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AVANT-PROPOS 


Il est d'usage de désigner sous le terme « cybernétique » tout un 
essaim de nouvelles théories scientifiques, qui, apparues au cours 
des dernières décennies, trouvent un emploi remarquablement large 
dans le domaine de l’automatique et de la télémécanique. Les cours 
professés aux étudiants qui se consacrent à ces spécialités, comportent 
des notions de la théorie de l’information, de la théorie de la détec- 
tion statistique des signaux, de la théorie des systèmes optimaux. 
de la théorie des automates finis, ainsi qu’une série de principes 
relevant de la théorie des jeux et de la théorie des décisions statisti- 
ques. 

Or, le professeur qui se propose d’enseigner aux étudiants des 
problèmes de la cybernétique se heurte à une difficulté sérieuse: 
le cours traditionnel des mathématiques supérieures lu dans les 
écoles supérieures d'enseignement technique est axé sur le continu 
et le déterminé, ce qui est insuffisant pour l’étude des nouvelles 
disciplines, basées principalement sur le discret et l'aléatoire. Ces 
questions peuvent être traitées soit dans le Cours des fondements 
mathématiques de la cybernétique, soit dans le Cours des fondements 
théoriques de la cybernétique. 

L'ouvrage proposé est basé sur les conférences lues aux étudiants 
de la spécialité « Automatique et Télémécanique » et de quelques 
spécialités connexes à l’Institut Radiotechnique de la ville de Riazan. 

Le présent Cours comprend une Introduction et deux parties 
divisées en dix chapitres. 

A l’Introduction, à côté de la notion de système cybernétique, 
on donne au lecteur certains renseignements sur les systèmes de 
communication et de commande, afin de pouvoir illustrer ensuite les 
méthodes mathématiques exposées par des exemples familiers aux 
spécialistes dans ce domaine. 

La première partie contient plusieurs chapitres de mathématiques’ 
absolument indispensables à l'ingénieur. A elle seule, la première 
partie est déjà d’une grande utilité, car les méthodes qu'elle expose 
permettent de résoudre toute une série de problèmes pratiques impor- 
tants du domaine de l’automatique et de télémécanique. Par ailleurs, 
les matières y sont disposées de telle façon que la première partie 
constitue une sorte d'initiation mathématique à la deuxième partie 
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qui est consacrée à l'optimisation des processus de commande et qui 
se donne pour tâche d'initier l’étudiant aux notions de la théorie 
moderne de la gestion. 

Dans ce petit nombre de pages, bien évidemment, nous n’avons 
pu exposer qu’un petit nombre de notions et méthodes de la cyber- 
nétique ; cela est vrai tant pour la première partie que (surtout) pour 
la deuxième. En particulier, l'optimisation des processus de commande, 
qui représente un chapitre essentiel de la théorie générale de la 
gestion, fait un large usage des procédés de l’analyse mathématique 
classique et du calcul variationnel classique. Les méthodes d’opti- 
misation de la commande, basées sur ces procédés et traitées généra- 
lement dans le Cours de la théorie de la commande automatique 
et dans plusieurs cours plus spécialisés, n’ont pas trouvé de place 
dans ces pages. Par contre, nous avons accordé le maximum d’atten- 
tion aux idées et méthodes qui ont vu le jour à cause de l’évolution 
de la cybernétique et des ordinateurs. Or, même dans ces cas, on a été 
souvent obligé de ne faire qu'une description assez sommaire des 
idées fondamentales. 

Il est à noter que, bien que la presque totalité des méthodes 
exposées ait été illustrée par des exemples et des problèmes à résou- 
dre, c’est encore la résolution de problèmes par ses propres forces qui 
reste pour l'étudiant l’unique moyen d'apprendre à fond les méthodes 
de calcul numérique ; aussi ce cours devra-t-il être complété par des 
cours pratiques et par des devoirs de calcul distribués aux étudiants 
de la spécialité. 

Nous tenons à exprimer notre profonde reconnaissance à L. Kou- 
zine et D. Pospélov, qui ont bien voulu se charger de la critique du 
livre, et au rédacteur N. Glazounov, dont les remarques très précieu- 
ses ont beaucoup ajouté à la valeur du livre. 


Y. Korchounov 


INTRODUCTION 


1-1. OBJET DE LA CYBERNÉTIQUE 


Science jeune, apparue au lendemain de la Seconde guerre mon- 
diale, la cybernétique a connu un essor tellement prodigieux qu'elle 
occupe à présent, dans de nombreux domaines de la science et de la 
technique, des positions tres stables. Les succès de la cybernétique 
sont dus à la découverte d’un certain nombre d'’analogies existant 
entre le fonctionnement des dispositifs techniques, la vie des orga- 
nismes et le comportement des collectivités d'êtres vivants. La 
cybernétique a complété ces analogies, qui résultent de certains 
raisonnements généraux de caractère méthodologique, par des métho- 
des mathématiques spéciales permettant de donner une définition 
quantitative aux processus se produisant dans des systèmes physiques 
trés variés. Les principes de la cybernétique trouvent un large 
emploi en automatique, télémécanique, théorie des communications, 
économie, sociologie, biologie et médecine [1 à 51]. 

Le mot « cybernétique » vient de la langue grecque. Les Anciens 
employaient ce mot pour designer l’art de gouverner le navire. Au 
XVIIIe siècle nous rencontrons ce mot dans les ouvrages de A. M. 
Ampère, grand physicien et mathématicien français, qui définit 
par ce mot la partie de la politique qui s'occupe des moyens de gou- 
verner. Nous entendons aujourd'hui, sous ce terme, la science de 
la gestion au sens très large. Le contenu moderne de cette notion est 
lié au nom du savant américain Norbert Wiener, dont le livre 
« Cybernetics, or Control and Communication in the Man and the 
Machine » paru en 1948 a posé la première pierre de cette discipline 
moderne. 

L'apparition de la cybernétique en tant que science de la gestion 
est étroitement liée au progrès technique général caractérisant l’évo- 
lution des forces de la production à l’époque actuelle. 

Avant l'apparition de la cybernétique, les techniciens voyaient 
leur tâche principale, premièrement, à mettre au point les disposi- 
tifs servant à obtenir et à transformer l’énergie (machines à vapeur, 
turbines, génératrices électriques, moteurs électriques, etc.), et 
deuxièmement, à créer les dispositifs susceptibles d'agir sur l’envi- 
ronnement. De pareils dispositifs se caractérisaient essentiellement 
par des rapports énergétiques, et leur paramètre principal est le 
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rendement, ou le débit. Assez élémentaires du point de vue techni- 
que, ces dispositifs ne posaient aucun problème quant à leur com- 
mande. L'homme pouvait travailler et commander l’objet de son 
travail en même temps. L'information nécessaire pour la commande 
lui parvenait directement par ses sens quand il observait les résultats 
de ses efforts. 

Cependant, au milieu du XX siècle, le progrès de la science 
a permis la construction de systèmes techniques tellement compli- 
qués que leur commande représentait pour l’homme une täche phy- 
siologiquement impossible. Par exemple, vers la fin de la Seconde 
guerre mondiale, les chercheurs se sont trouvés devant le problème 
de création d’un système de conduite de tir automatique antiaérien 
tel qu’il puisse, sans la participation de l’homme, assurer la poursuite 
des avions volant à des vitesses comparables à celles des projectiles 
antiaériens, effectuer le calcul de leur trajectoire et réaliser le poin- 
tage des canons. Dans de pareils systèmes, il s’agit en premier lieu 
d'obtenir l’information sur la situation du moment, de traiter cette 
information de manière à en tirer les données utilisables pour la com- 
mande et de mettre à profit cette information pour des actions ayant 
un but précis; en d’autres mots, le problème se ramène à créer cer- 
tains dispositifs de communication et de conmande. La nécessité de 
résoudre ces problèmes a stimulé les rapides progrès réalisés dans la 
théorie des communications, dans les techniques de calcul et dans 
l’automatique ; les notions dégagées au cours de ces travaux furent 
ensuite mises à la base de la cybernétique. 

La différence fondamentale entre les dispositifs de communica- 
tion et de commande d’une part et les dispositifs techniques dont il 
a été question plus haut d'autre part réside dans le fait que les rap- 
ports énergétiques cessent désormais de jouer le rôle prépondérant ; 
par contre, l’attention est accordée principalement à la faculté de 
ces dispositifs de transmettre et de traiter de grandes quantités 
d’information sans les déformer en aucune façon. C’est ainsi que dans 
la liaison radio le récepteur ne capte qu'une partie infime de l'énergie 
émise par l’antenne de l’émetteur, de sorte que le rendement se 
trouve très bas. Or, la bonne qualité d’une ligne de transmission 
consiste en ce que les messages captés ne subissent que de très petites 
déformations et que l'influence des parasites est exclue. Donc, les 
processus fondamentaux se produisant dans les systèmes de commu- 
nication et de commande sont les processus de transmission et de 
traitement de l'information, et non pas les processus liés à la transfor- 
mation et à l’utilisation de l'énergie. 

L'insignifiance des rapports énergétiques dans les problèmes de 
communication et de commande permet de faire abstraction des 
particularités physiques des supports d’information et de la nature 
physique des systèmes dans lesquels cette information est utilisée ; 
aussi la cybernétique est-elle appelée à fournir une théorie générale 
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de la communication et de la commande, applicable à tous les sys- 
tèmes, quelle que soit leur nature physique. 

La notion de système, à côté de celle de gestion (ou de commande), 
est la notion fondamentale en cybernétique; sa signification exacte 
sera étudiée en détail plus tard. Tout système existant en réalité se 
compose d'objets concrets: dispositifs techniques, personnes com- 
mandant ces derniers, ressources matérielles, etc. Ces objets sont liés 
entre eux et à l’environnement par des liaisons déterminées: forces, 
courants d'énergie, de substances, 


d’information. Or, la cybernétique 
fait abstraction du contenu physi- | | 
que des propriétés des objets et des J 


liaisons ; elle considère le système 
réel comme un ensemble abstrait 
d'éléments possédant des proprié- 
tes communes et liés les uns aux 
autres par des relations détermi- 
nées par la nature des liaisons exis- 
tantes. Une pareille représentation 
permet d'abandonner l’habituelle 
division des systèmes en systèmes 
mécaniques, électriques, chimi- 
ques, biologiques, etc., et d’intro- 
duire la notion de système cyberné- 
tique abstrait désignant l’ensemble d'éléments liés entre eux et se 
trouvant en interaction. On voit sur la figure Î-1 un exemple de 
système cybernétique à quatre éléments et à six liaisons réciproques. 

La représentation du système sous la forme d’un ensemble d’élé- 
ments permet de donner sa définition mathématique en termes de la 
théorie des ensembles. Dans certains cas fort importants, les liaisons 
existant entre les éléments se laissent définir aisément par les moyens 
de la logique mathématique. Aussi ces deux disciplines — la théorie 
des ensembles et la logique mathématique — se trouvent-elles à la 
base de la définition mathématique du système; elles constituent 
pour cette raison les chapitres liminaires de cet ouvrage. 

Les systèmes que l’on rencontre dans la pratique se divisent, en 
fonction de leur structure et du caractère des liaisons, en systèmes 
déterministes et systèmes probabilistes. On dit que le système est 
déterministe quand on connaît avec précision les lois de son mouvement 
et son comportement à l'avenir. En ce qui concerne un système 
probabiliste, son comportement ne peut jamais être prédit exactement 
a priori. Un mouvement d’horlogerie est un système déterministe ; 
par contre, les systèmes de contrôle statistique de la production, 
les systèmes d'arrivée des navires aux ports maritimes, le stock des 
marchandises dans un magasin desservant un grand nombre de four- 
nisseurs et d'acheteurs sont des systèmes probabilistes. 


Fig. I-1. Exemple d'un système 
cybernétique 
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Les problèmes traités par la cybernétique exigent dans la plupart 
des cas l'étude d'assez complexes systèmes probabilistes, composés 
d'un grand nombre d’éléments et présentant des liaisons internes 
variées et ramifiées. Tels sont notamment la plupart des systèmes 
de production, des systèmes économiques, sociaux, biologiques. La 
définition mathématique de ces systèmes nécessite l'emploi très 
large des méthodes relevant de la théorie des probabilités et de la 
statistique mathématique, sans parler de la théorie des ensembles et 
de la logique mathématique. 

Nous n'avons mentionné jusque-là que les méthodes mathé- 
matiques employées pour définir les systèmes cybernétiques. Or, 
le but de la cybernétique est la commande des systèmes, ou la 
gestion. Pour rechercher les moyens de résolution de ce problème, 
il est nécessaire de se faire une idée bien nette de ce qu'est la 
« gestion ». 

Au sens large, on entend par gestion l’activité menée pour gouver- 
ner le travail de l’autrui orienté vers des buts précis. Le processus 
de la gestion consiste à prendre des décisions sur les actions les plus 
raisonnables dans le contexte de la situation existante. Celui qui 
effectue la gestion prend les décisions après avoir apprécié la situa- 
tion sur la base de l'information reçue par ses sens, ou à l’aide d'ins- 
truments de mesure, ou par l'entremise d’autres personnes. Bien 
souvent, l'information reçue s'avère insuffisante pour apprécier la 
situation de façon univoque. Alors l’homme fait appel à son expé- 
rience, à ses connaissances, à sa mémoire, à son intuition. Une qua- 
lite remarquable de l’homme est justement sa faculté de prendre les 
décisions dans des circonstances très incertaines. 

Or, dans les grandes entreprises modernes, même un administra- 
teur très expérimenté ne peut réaliser une gestion efficace s’il s’ap- 
puie exclusivement sur ses connaissances et sur son intuition. Cet 
état de choses est la cause des carences fréquentes dans le fonctionne- 
ment des entreprises importantes: le travail par saccades ; l’impos- 
sibilité d'assurer le ravitaillement normal en matières premières et 
matériaux sans gonfler démesurément les stocks; les problèmes de 
transport qui s’aggravent, etc. 

La cybernétique se donne pour tâche de faciliter à l’homme la 
prise des décisions importantes, en confiant à des machines automa- 
tiques la collecte et le traitement d'énormes quantités d’information 
relative à l’état de la production, l'analyse des situations existantes 
et l'élaboration des recommandations sur les actions les plus avanta- 
geuses. Les dispositifs automatiques assumant l’ensemble de ces 
opérations sont désignés sous le terme de systèmes de gestion automa- 
tiques. Ces systèmes se basent sur l’emploi des machines à calcul 
numériques, ou ordinateurs. 

Le rôle des ordinateurs en cybernétique est tellement important 
qu'il convient pen parler d'une façon plus détaillée. 
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Au début, les ordinateurs ne s’employaient que pour faire des 
calculs traditionnels en quelques secondes au lieu de nombreuses 
heures. Or, on s’est vite rendu compte que l'accélération vertigineuse 
des opérations de calcul recèle des traits nouveaux. Auparavant, de 
l’infinité des solutions possibles, le projeteur ou l’économiste ne 
pouvait analyser que quelques-unes, celles qu'il a jugées (pour une 
raison quelconque) les plus dignes d'attention; aujourd’hui au con- 
traire, il se trouve en mesure de les étudier toutes et d’en choisir la 
meilleure. C’est là que prennent naissance les idées d'optimisation, 
qui donneront naissance plus tard à toute une série de branches 
nouvelles des mathématiques. 

On a découvert ensuite que l'ordinateur utilisé dans une entreprise 
de production assume sans peine le traitement des masses importan- 
tes d’information et représente donc un collaborateur précieux de 
l’homme dans le processus de la gestion. 

Pour pouvoir utiliser les ordinateurs dans les buts de la gestion, 
on a eu besoin des méthodes mathématiques permettant d'analyser 
l'information parvenue, d'éliminer les informations inutiles et de 
mettre en valeur l'information la plus essentielle, d'employer cette 
information pour apprécier la situation existante et d'élaborer les 
recommandations propres à assurer la réalisation optimale des buts 
de gestion fixés. La nécessité de résoudre les problèmes de ce genre 
a fait naître de nouvelles branches des mathématiques, telles que 
théories de l'information, des jeux, des décisions statistiques, des 
files d'attente, programmation linéaire et dynamique, etc.’ Quel- 
ques-unes de ces méthodes mathématiques modernes seront exposées 
dans ce livre; d’autres font l’objet des cours appropriés. 
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Les liaisons existant entre les éléments d’un système peuvent 
servir à des fins différentes, par exemple à transmettre l'énergie, les 
substances, les efforts, etc. Or, dans les systèmes cybernétiques, c’est 
le contenu informationnel des liaisons qui nous intéresse en premier 
lieu, ou, en d’autres mots, la possibilité d'utiliser les liaisons pour 
transmettre les données sur les différents états des éléments du 
système. 

Toute information concernant un événement quelconque se pro- 
duisant à l'intérieur ou à l'extérieur du système est désignée en 
technique sous le terme de message. Les liaisons informationnelles 
servant à transmettre des messages sont appelées canaux de commu- 
nication. Les supports physiques de l'information circulant dans 
les canaux de communication sont les signaux. On voit sur la figu- 
re [-2 le schéma fonctionnel d’un canal de communication. 

Le mot « signal », provenant du lat. signum, désigne les signes 
conventionnels électriques, sonores, optiques et autres destinés 
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à transmettre les messages. Généralement, la nature des signaux 
fait l’objet d’une convention entre la personne désirant transmettre 
l'information et la personne qui la reçoit ; elle n’a pas de liaison 
directe avec le contenu de l'information véhiculée. Aussi peut-on 
aisément transformer les signaux d’une nature en ceux de nature 
différente sans changer le contenu de l'information et conserver ces 
signaux (après les avoir mis, par exemple, sous la forme d’une nota- 
tion littérale) afin d'utiliser à l’avenir l'information qu'ils portent. 

Considérons, à titre d'exemple, les signaux utilisés en télégraphie. 
Le message initial écrit sur l’imprimé postal est transcrit à l’aide 
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Fig. I-2. Schema fonctionnel d’un canal de communication 


du code Morse formé de points et de traits et est envoyé ensuite par 
la ligne de communication sous la forme d’impulsions de courant 
de courte et de grande durée. D’après ces impulsions, le récepteur 
reconstitue le contenu du texte. Nous voyons donc que le message 
existe dans le cas considéré sous la forme de signaux de forme diffé- 
rente: un texte littéral, points et traits du code Morse. impulsions 
s de courant dans la ligne de communication, etc. L'action de faire 
passer le signal d’une forme à une autre s'appelle codage. 

La communication se présente donc comme suit. On crée tout 
d’abord un ensemble de symboles: lettres, mots, points, traits, etc., 
dont le sens est connu tant de l’auteur du message que du récepteur. 
Cet ensemble de symboles porte le nom d'’alphabet. Les symboles 
eux-mêmes sont précisés par convention. 

La thèse fondamentale de la théorie des communications stipule 
que les symboles constituant un alphabet ne peuvent être variés 
à l'infini. Pour cette raison la transmission des messages de toute 
sorte se réalise avec un nombre restreint de symboles. C'est ainsi 
que tous les messages possibles en langue russe se construisent avec 
un alphabet de 33 lettres. 

Au cours de la communication, le transmetteur choisit dans son 
alphabet les symboles un à un, les transforme en signaux correspon- 
dants et les envoie par le canal de communication. Dans ce dernier, 
les signaux subissent l’action de parasites et se déforment, ce qui 
fait que les signaux captés par le récepteur diffèrent des signaux 
envoyés. 
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Le processus de la réception consiste en ce que le destinataire, 
après avoir reçu un signal quelconque, l’identifie à l’un des symboles 
de l’alphabet, c.-à-d. exclut tous les symboles sauf un. Ce problème 
se complique considérablement lorsque les signaux subissent de 
fortes déformations pendant leur passage par le canal de communica- 
tion. Ce sont les méthodes de lutte contre ces difficultés qui consti- 
tuent l'essentiel de la théorie des communications. 

Les alphabets utilisés dans les systèmes de communication techni- 
ques sont assez variés. Cependant, pour certaines raisons, on adopte 
très souvent l'alphabet binaire n'emplovant que deux espèces de 
symboles, représentés conventionnellement par les chiffres O et 1, 
de sorte que tout message se présente comme une succession de zéros 
et d'unités, par exemple 100110100. 

Il est facile de calculer le nombre total de messages composés 
de m lettres d’alphabet binaire ; ce nombre est égal à 2". En particu- 
lier, n'importe quelle lettre de l’alphabet français peut être repre- 
sentée au moyen de six signes de l'alphabet binaire, par exemple, 
a —= 000001, b — 000010, c — 000011, etc. Puisque six signes binaïi- 
res permettent 2° — 64 combinaisons différentes de symboles, on 
a la possibilité d'exprimer non seulement toutes les lettres de l’alpha- 
bet mais aussi les signes de ponctuation. Par conséquent, l’alphabet 
binaire permet de représenter et de transmettre par le canal de com- 
munication n'importe quel message littéral. 

L’alphabet binaire convient aussi pour la transmission des don- 
nées numériques; cependant, pour le faire, on est amené à utiliser 
des systèmes de numération particuliers. 

Dans le système de numération décimale universellement répandu 
les différents nombres s’écrivent au moyen de dix chiffres O, 1,...,9 
disposés dans un ordre déterminé et prenant des valeurs différentes 
en fonction du rang occupé par chaque chiffre. Par exemple, l’écritu- 
re 395 correspond au nombre déterminé par la relation 


3 +10? + 9.10! + 5.109. 


Le nombre 10 est dit base de la numération. 

De façon analogue, on écrira n’importe quel nombre W à l'aide 
d’un autre système de numération. ayant pour base n'importe quel 
nombre entier R, au moyen de chiffres dont la quantité est égale 
à la base de la numération. L'écriture . . . d.d.d,d,, où d, sont les 
chiffres du nombre N (0< d; << R) détermine alorsfla quantité 


N=... dR8+dR?+ diR! + dR. (1-1) 
Ainsi, en système de numération octal (employé dans certaines 


machines à calcul numériques), le nombre 395 peut être repré- 
senté comme suit: 


6 .8* + 1.81 + 3.89, 


donc s’écrira comme 613. 
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Si l’on adopte l'alphabet binaire, un nombre ne s’écrira qu'avec 
les symboles 0 et 1. Cette écriture est possible avec le système de 
numération binaire de base 2. N'importe quel nombre de 0 à 15 peut 
s’écrire dans le système binaire à l’aide d’un nombre à quatre chiffres : 


3 = 0-2% + 0.2* + 1.21 + 1.20, c.-à-d. 0011; 
o = 0.23 + 1.25 + 0.21 + 1.29, c.-à-d. 0101; 
9 = 1.23 + 0.2* + 0.21 + 1.29, c.-à-d. 1001. 


Naturellement, on peut omettre d'écrire les zéros dans les rangs 
supérieurs de ces nombres, si bien que les nombres 3 et 5 s'écriront 
comme 11 et 101. Le nombre 395, transcrit avec la base 2: 


395 = 28 + 27 + 25 LE 21 LE 20, 


s’écrira dans le système binaire au moyen d’un nombre à neuf chiffres 
110001011. 

L’inconvénient du système binaire est que l’écriture des grands 
nombres exige une quantité exagérée de chiffres, ce qui complique 
la lecture des nombres et l’appréciation rapide de leur ordre de gran- 
deur. Aussi emploie-t-on souvent des systèmes de numération de 
base mixte, par exemple le système décimal-binaire dans lequel le 
nombre lui-même s'écrit en décimal et les chiffres de ses différents 
rangs, en binaire, avec utilisation de quatre rangs binaires pour 
chaque chiffre décimal. Le nombre 395 se présente en décimal- 
binaire comme suit: 

0011 1001 0101 
— = ‘y 
1) 


9 5) 


I-3. NOTION DE SYSTÈME COMMANDÉ 


Conformément à la définition de la gestion (ou de la commande) 
donnée ci-dessus, on peut représenter tout système commandé comme 
l’ensemble de deux parties: une partie commandée, dite objet de la 
commande, et une partie qui effectue la commande, dite organe de 
commande ou opérateur [6]. 

L'objet de commande se caractérise par: 

1) un but, ou la possibilité de fournir un résultat utile; 

2) un état, exprimé par des mouvements concrets et susceptible 
de varier par suite de variations des conditions extérieures dans les- 
quelles l’objet est place ; 

3) la commandabilité, c.-à-d. la faculté de réagir aux sollicita- 
tions extérieures appliquées à ses organes appropriés, dits organes de 
commande. 

La mission de l’opérateur consiste à agir sur les organes de com- 
mande de façon que l’obiet réalise son but. A cet effet, on doit établir 
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entre l'opérateur et l'organe de commande un échange d’information 
réciproque. L'information en question est portée, d’une part, par les 
signaux de commande à l’aide desquels l'opérateur agit sur l’objet 
de commande: c’est l'information de commande, et d'autre part, par 
les données sur l’état de l’objet commandé à la base desquelles 
l'opérateur choisit les signaux de commande: c’est l'information en 
retour. 

Le schéma fonctionnel de la figure 1-3 montre les courants d'in- 
formation essentiels dans le système commandé. Outre les courants 


Înformotion de commondr 


{Information | 
sur le but de !/o {rfluence 
commande el Sur perturbotrice 
les Concitions ou rmilieu ormbiont 
extérieures : 


{nforrmotion en retour 
Feed - bac) 


Fig. I-3. Circulation de l'information dans un système commandé 


de circulation de l'information de commande et de l'information en 
retour, on y distingue la liaison de l’objet commandé et de l'opéra- 
teur avec le milieu ambiant. Toute variation des conditions extérieu- 
res exerce une influence directe sur l’objet commandé en modifiant 
le caractère de son mouvement et en l’empêchant d'atteindre son but. 
Pour que la commande de l’objet soit efficace, il faut que l’opérateur 
dispose de l'information sur les conditions extérieures et puisse en 
tenir compte à l'élaboration des signaux de commande; il doit encore 
connaître le but poursuivi par la commande. 

L'information de commande résulte du traitement de toutes les 
catégories de l'information arrivant à l’opérateur. Une partie d'in- 
formation peut être conservée pour être utilisée dans l’avenir. Les 
fonctions d'opérateur peuvent être remplies tant par l’homme que par 
un dispositif artificiel, soit mécanique, soit électronique. Aujourd hui 
le rôle d’opérateur est souvent confié à des ordinateurs, universels 
ou spécialisés. 

Dans l’objet commandé, il se produit le traitement de l’informa- 
tion de commande, qui se manifeste par la variation du caractère 
du mouvement de l’objet. Sous la forme de l'information en retour, 
ces variations sont transmises à l'opérateur par le canal de liaison 
en retour. 

La liaison en retour (ou réaction, ou feed-back) joue un rôle fonda- 
mental dans la commande efficace, car elle permet à l'opérateur 
d'apprécier à tout moment le degré de réalisation du but fixé et 
d'élaborer en conséquence les signaux de commande de la façon la 
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plus rationnelle. Aussi le principe de la réaction est-il mis à la base 
de la plupart des processus de commande et, en particulier, à la 
base de presque toutes les activités de l’homme. Par exemple, quand 
il tend sa main pour prendre un crayon sur la table, l’homme effec- 
tue une comparaison permanente, quoique inconsciente, des posi- 
tions mutuelles de la main et du crayon, grâce à quoi le mouvement 
prend un caractère remarquablement net. 

Le principe de la réaction est étudié en détail dans le cours de 
« Théorie de la commande automatique ». Le présent cours, lui, 
vise à étudier les méthodes de définition mathématique des sys- 
tèmes de commande automatique et de mettre en valeur les procédés 
et les techniques de la prise de décision mis à la base des dispositifs 
de commande. 

A l’aide de quelques exemples de systèmes de nature physique 
différente, essayons de rendre plus clair le schéma général du proces- 
sus de la commande. 


Exemple I-1. Régulateur centrifuge des tours d'une machine à vapeur 
(fig. 1-4). L'opérateur du système considéré est le régulateur centrifuge des tours. 
L'organe de commande est la vanne réglant la pénétration de la vapeur dans la 


Réputateur 
centrifuge 


7 Vanne 


Moctune | Vopeur 
| à vapeur —— 


Fig. 1-4. Schéma de régulation de la vitesse d’une machine à vapeur 


machine. Avant le commencement du travail, on doit introduire dans le régu- 
lateur l’information sur le but de la commande, ce qu’on fait en affichant sur 
le régulateur le nombre des tours à maintenir w, par la disposition appropriée 
des masselottes et par la variation de la tension des ressorts. Le régulateur cen- 
trifuge transforme l'information en retour sur le nombre de tours réel w de la 
machine en variation de la hauteur k du manchon; cette information de comman- 
de, par l’intermédiaire du levier, se transforme en information sur la position 
de la vanne qui modifie l’arrivée de la vapeur et fait varier, par là même, les 
tours de la machine. L'influence du milieu ambiant se manifeste ici par la va- 
riation de la charge sur la machine à vapeur, ce qui fait changer la vitesse de 
rotation. 

Exemple I-2. Dispatcher de chemin de fer. Le rôle d’opérateur est confié ici 
à un homme, le dispatcher, qui, se trouvant dans le dispatching, reçoit par inter- 
com ou par téléphone l'information en retour sur l’état des trains dans le sec- 
teur qui lui est confié. Cette information se présente sous la forme de messages 
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concernant la préparation d’un train à la mise en marche, le retard d’un train 
par rapport à l'horaire établi, la nécessité de former un train spécial (non prévu 
par l’horaire), l'occupation de la voie, etc. La mission du dispatcher est de dé- 
pouiller l'information reçue et de prendre les décisions propres à assurer l'obser- 
vation la plus stricte de l'horaire des trains. Cette information de commande 
s'exprime en ordres adressés aux conducteurs de trains ou aux chefs de gares et 
prescrivant de changer le trafic (accélérer, retarder, garer un train, etc.). 
Exemple T-3. Guidage d'un missile antiaérien. En qualité d'exemple d’un 
système automatique desservi par une machine à calculer électronique, on donne 


Fig. 1-5. Système de guidage d’un missile antiaérien 


sur la figure 1-5 le schéma fonctionnel de guidage d'un missile antiaérien sur un 
but mobile. Dans ce système, l'information en retour est contenue en signaux 
délivrés par le radar de poursuite RP déterminant les éléments de position du 
but et par le radar de guidage RG déterminant les éléments de position du mis- 
sile lancé pour intercepter le but. Le calculateur de guidage CG, à la base de cette 
information, élabore les signaux qui, émis par radio et captés ensuite par l'or- 
gane de direction du missile, corrigent le vol de celui-ci en fonction de la posi- 
tion réciproque du missile et du but. 


PROBLÈMES À L'INTRODUCTION 


1-1. Le système comporte sept éléments dont chacun est lié à tous les autres 
ar des liaisons élémentaires bistables, c.-à-d. n'ayant que deux états: « la 
iaison existe » et « la liaison n'existe pas ». Quel est le nombre des états possi- 

bles d’un pareil système? En combien de temps pourra-t-on analyser tous les 
états possibles ossédant la propriété P si l’étude expérimentale d’un seul état 
dure 1 seconde? 

1-2. Supposons que le système considéré en 1-1 ne comporte que des liaisons 
dirigées successives (fig. I-6, a) ou qu'il a la structure hiérarchique (fig. 1-6,b). 
De combien se réduira le nombre de tous les états possibles de ce système? 
Citer quelques exemples de systèmes ayant les structures des deux types. 

1-3. Le polynôme (1-1) servant à représenter un nombre en système de numé- 
ration de base R peut être écrit sous la forme 


N = {[(-..ds) R + dj R + di} R + do (1-2) 
2—0732 
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ce qui équivaut à la succession de formules 
N=NR+d, M=NR+d Na= NR +. 


Utilisant ces formules, argumenter la règle suivante de passage du nombre 395 
du système décimal au système octal: 


395 : 8— 49 reste 3 ou en abrégé 395 
49:8—6 reste À 49 


3 
6:8—=0 reste 6 4 
6 


© 


ce qui donne le nombre octal 613. 
Comment peut-on définir la règle de passage d’un nombre du système décimal 


au système binaire? 


a) 
b) 


Fig. I-6. Systèmes aux liaisons successives (a) et à structure hiérarchique (b) 


I-4. Ecrire en systèmes binaire, octal et sexdécimal les nombres décimaux 
suivants (qui sont donnés en système de numération décimal) : 


27, 467, 519, 1263. 


Nota. Pour les chiffres de 10 à 15 du système sexdécimal, employer les 
lettres de l'alphabet latin a, b, c, d,e, f. 

1-5. Ecrire les nombres du problème I-4 en décimal-binaire et en octal- 
binaire. Combien de rangs binaires doit-on occuper pour écrire un chiffre octal? 
Lequel de ces deux systèmes est plus économique au point de vue de la quantité 
de nombres binaires utilisés? 

1-6. Etablir s’il existe le circuit de réaction dans les systèmes de régulation 
de la circulation routière: 

4) gr les feux rouge, orange et vert s’allumant à tour de rôle pour une 
durée établie à l’avance:;: 
2) par un agent de circulation. 
I-7. Trouver le circuit de réaction dans les schémas des figures I-4 et I-5. 


INDEX DES NOTATIONS 


{...} — ensemble 
€ — appartenance d’un élément à un ensemble 
é — non-appartenance à un ensemble 
= — symbole d’inclusion 
« — symbole d’inclusion stricte 
U — réunion d'ensembles 
N — intersection d’ensembles 
NX — différence d’ensembles 
X — produit direct d’ensembles 
X — complémentaire de l’ensemble X 
X3 — puissance de l’ensemble 
ff — ensemble vide 
1 — ensemble universel 
R — ensemble des nombres réels 
M — système d’ensembles 
sup M — borne supérieure de l’ensemble M 
inf M — borne inférieure de l’ensemble M 
pr, M — projection de l’ensemble sur l'axe des i 
(a, -…. 4h) — ensemble ordonné (cortège, vecteur) 
A — cortège vide 
V — quantificateur universel 
æ — équivalence logique 
— — inférence, application 
f o g — composée des fonctions f et g 
= — symbole de relation d'équivalence 
< — symbole de relation d'ordre 
<< — symbole de relation d'ordre stricte 
© — symbole de relation de dominance 
d (x, y) — distance des éléments d'un ensemble 
| x I] — norme de zx 
n — espace euclidien à n dimensions 
Cfa, by — espace des fonctions continues 


zly — fonction de Sheffer 
x — inversion de la proposition z 
@ — addition modulo deux 
Z — espace des épreuves 
Z — épreuve liée £ l'expérience, variable aléatoire 
z — variable aléatoire centrée 
p (:), : €Z — distribution des probabilités sur l’espace Z 
P (S), Ps — probabilité de l'événement 
p (z/S) — distribution conditionnelle des probabilités 
p (y, z) — distribution commune des probabilités 
2, V, M (2), f(z2)  — valeur moyenne 
0, 0, — écart quadratique moyen 


2e 
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R (v, ©) — distribution uniforme 
N (v, 0°) — distribution normale 
w (r, n, p) — distribution binomiale 
w (r, a) — distribution de Poisson 
u — commande 
Ÿ — état de la nature 
x — état du système 
T (z, u) — transformation de l’état du système 
g (x, u), Q (x, u) — fonction objectif 
J (u), J, (u) — critère de qualité de la commande 
E,n — stratégies mixtes 
L(£&, n) — fonction de pertes 
À — espace des decisions 
a — décision, action 
a* — action de Bayes 
R* (E) — pertes correspondant à l'action de Bayes 
d (z) — fonction de décision 
p (8, d) — fonction de risque 
p* (£) — risque de Bayes 


PREMIÈRE PARTIE 


ÉLEMENTS DE MATHÉMATIQUES DISRÈTES 


CHAPITRE PREMIER 


NOTIONS ESSENTIELLES 
DE LA THÉORIE DES ENSEMBLES 


1-1. ENSEMBLES FINIS ET INFINIS 


a) Définitions principales 


La notion d'ensemble [7 à 9] est une des entités mathématiques 
difficilement assignables à l'aide de notions élémentaires, aussi 
devra-t-on se borner à lui donner une explication descriptive. On 
entend par ensemble une collection d'objets bien distincts considérés 
comme formant un tout. 

On peut parler de l’ensemble des chaises garnissant une pièce; 
de l’ensemble des habitants de la ville de Riazan; de l’ensemble des 
étudiants d’un groupe; de l’ensemble des entiers naturels; de l’en- 
semble des lettres d’un alphabet ; de l’ensemble des états d’un sys- 
tème, etc. Dans tous ces cas il ne s'agira d’un ensemble que lorsque 
les éléments de cet ensemble sont différenciables. Par exemple, on 
ne peut parler de l’ensemble des gouttes d'eau contenues dans un 
verre, vu qu'il n’est pas possible de définir nettement chaque goutte 
isolée. 

Les objets isolés constituant l’ensemble sont dits éléments de 
l’ensemble. C’est ainsi que le nombre 3 est un élément de l’ensemble 
des entiers naturels: la lettre b est un élément de l’ensemble des 
lettres de l'alphabet latin. 

Pour désigner d’une manière générale un ensemble, on emploie 
les accolades { } à l’intérieur desquelles on énumère les éléments 
de l’ensemble. Les ensembles concrets sont désignés par des lettres 
capitales 4, S, X, . .. ou par des lettres majuscules munies d'’indi- 
ces À,, À:, . . . Pour désigner sous une forme générale les éléments 
d'un ensemble, on utilise des lettres minuscules a, s, zx, . .. ou des 
lettres minuscules affectées d'indices &;,, &@e+, .. 

Pour dire que l’objet a est élément de l'ensemble S, on écrira 
a € S ; cette écriture se prononce « a est élément de S » ou « a appar- 
tient à S ». Pour dire, au contraire, que a n’est pas élément de l’en- 
semble S$, on écrira a £,S. La notation z;, z:, ..., zx ES sera 
employée pour abréger l'écriture zx, ES, x ES, ..., tn ES. 
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Il y a des ensembles finis et infinis. On dit que l’ensemble est 
fini si le nombre de ses éléments est fini, c.-à-d. s’il existe un nombre 
naturel W qui est le nombre des éléments de l’ensemble. Un ensemble 
est dit infini quand il contient un nombre infini d'éléments. 

Pour pouvoir opérer avec des ensembles concrets, on doit savoir 
les définir. Il existe deux modes de définition d’un ensemble : énumé- 
ration et description. La définition énumérative d’un ensemble con- 
siste à enumérer tous les éléments qui le forment. C’est ainsi que pour 
définir l’ensemble des étudiants d’un groupe qui ont toutes les notes 
excellentes, on peut nommer tous les étudiants qui satisfont à cette 
condition, par exemple: {Ivanov, Pétrov, Sidorov}. Ce mode de 
définition convient lorsqu'on a affaire à des ensembles finis de peu 
d'éléments; or, il peut servir quelquefois à définir aussi bien des 
ensembles infinis, tels que {2, 4, 6, 8, ...}. On conçoit qu'une 
notation pareille n’est valable que si l’on comprend clairement la 
signification des points de suspension. 

La définition descriptive d’un ensemble revient à indiquer une 
propriété caractéristique commune à tous les éléments de l’ensemble. 
Par exemple, si M est l’ensemble des étudiants du groupe, l'ensem- 
ble À des étudiants de ce groupe qui ont toutes les notes excellentes 
s'écrira comme suit: 


A = {2€ M: x est un étudiant dont toutes les notes 
sont excellentes}, 


expression que l’on prononce: ensemble À des éléments x définis 
sur l’ensemble M par la condition d’après laquelle z est un étudiant 
du groupe qui n’a que des notes excellentes. 

Dans les cas où il est très clair sur quel ensemble sont définis les 
éléments x, on omet d'indiquer que z appartient à M et l’on écris 


A —={zx: rest un étudiant dont toutes les notes sont excellentes}. 


Citons quelques exemples de définition descriptive de différents 
ensembles : 


{z: x est pair} est l’ensemble des nombres pairs; 
{x: x? — 1 = 0} est l’ensemble { + 1, —1}. 


Soit C l’ensemble des nombres entiers. Alors {x EC :0<z<7} 
est l’ensemble {1, 2, 3, 4, 5, 6, 7}. 

Un concept très important de la théorie des ensembles est celui 
d'ensemble vide. On dit que l’ensemble est vide quand il ne contient 
pas un seul élément. L'ensemble vide se désigne par le symbole G. 
Par exemple, 

{xCC:r—-2+1=0};=g. 


La notion d'ensemble vide joue un rôle très important lorsqu'il 
s'agit de définir un ensemble par description. Sans cette notion, 
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on ne pourrait parler de l’ensemble des étudiants du groupe qui ont 
toutes les notes excellentes, ou de l’ensemble des racines réelles 
d'une équation du second degré, sans voir au préalable s’il y a 
effectivement, dans le groupe donné, au moins un étudiant dont toutes 
les notes sont excellentes, ou que l'équation proposée admet des racines 
réelles. Faisant intervenir la notion d'ensemble vide, on peur opérer 
en toute tranquillité avec l’ensemble des étudiants du groupe qui ont 
toutes les notes excellentes, sans se soucier nullement du fait que ce 
groupe présente ou non des étudiants aussi brillants. Par convention, 
l'ensemble vide se range parmi les ensembles finis. 

Passons maintenant au problème d'égalité des ensembles. On dit 
que deux ensembles sont égaux quand ils sont formés des mêmes elé- 
ments, C.-à-d. quand ils représentent un seul et même ensemble. 
Deux ensembles X et Ÿ ne sont pas égaux (X =£ Y) quand il y a dans 
X des éléments qui n’appartiennent pas à Y, ou quand il y a dans 
Y des éléments qui n’appartiennent pas à X. On voit sans peine que 
pour des ensembles quelconques X, Ÿ et Z on a: 


X = X ; 
si À — Ÿ, alors Y = X ; 
si À = Ÿ et Ÿ = Z, alors À — Z. 


De la définition de l'égalité des ensembles il découle que l’ordre 
des éléments dans l’ensemble n’a pas d'importance. C’est ainsi que 
les ensembles {3, 4, 5, 6} et {4, 5, 6, 3} représentent un seul et même 
ensemble. 

Considérant des ensembles de différente nature, on est souvent 
amené à parler du nombre des éléments d’un ensemble. Pour que 
cette notion ait un sens bien déterminé, il faut préciser qu’un ensem- 
ble ne peut contenir d’éléments identiques. Une notation {2, 2, 3,5} 
sera considérée comme incorrecte et sera remplacée par la notation 


{2, 3, 5}. C’est ainsi que l’ensemble des diviseurs premiers du nombre 
00 est {2, 3, 5}. 


b) Notion de sous-ensemble 


Un ensemble X est sous-ensemble de l’ensemble Y si tout élément 
de X appartient aussi à Y. Soient Y l’ensemble des étudiants d’un 
groupe et À l’ensemble des étudiants du mème groupe qui ont toutes 
les notes excellentes. Du fait que l'étudiant dont toutes les notes sont 
excellentes est en même temps étudiant du groupe donné, l’ensemble 
X est sous-ensemble de l’ensemble Y. 

On formule aisément de nombreuses définitions relevant de la 
théorie des ensembles sous la forme d'expressions mathématiques 
contenant quelques symboles logiques. La définition du sous-ensemble 
sera donnée en employant deux symboles suivants: 


24 CH. 1. NOTIONS ESSENTIELLES DE LA THÉORIE DES ENSEMBLES 


V symbole appelé quantificateur et signifiant « n'importe quel » 
« quel que soit », « pour tout »; 

— symbole de l’inférence signifiant « entraîne ». 

Un sous-ensemble se laissant formuler de la sorte: pour tout x, 
l'assertion «zx appartient à X» entraîne l'assertion «zx appar- 
tient à Y », s’écrira comme suit: 


Vrz:zCX —zxcr. (1-1) 
L'’assertion « À est sous-ensemble de Y » s'écrit brièvement 
X=<=Y (1-2) 


et se prononce « Ÿ inclut X », ou « X est contenu dans Ÿ ». Le 
symbole = ci-dessus signifie l’inclusion. Pour souligner que Ÿ con- 
tient aussi des éléments autres que ceux de X, on fait appel au sym- 
bole d’inclusion stricte €: 


Xc ÿY. (1-3) 
La relation entre les symboles & et = se définit par 
XcYrX=srY et X ZT. (1-4) 


Le symbole = employé ici indique l’équivalence (au sens de 
« la même chose que »). 
Notons quelques propriétés du sous-ensemble qui résultent de sa 
définition: 
X=X (réflexivité); 
[X=Y et Y=Z]J—X=Z (transitivité). 


Un peu moins évidente est la propriété selon laquelle, pour tout 
ensemble À, on a 
SM. (1-5) 
En effet, l’ensemble vide @ ne contient aucun élément. Donc, 
ajoutant à M un ensemble vide, on n’y ajoute en réalité rien. Aussi 
peut-on dire toujours qu’un ensemble quelconque M contient un 
ensemble vide à titre de sous-ensemble. 


c) Borne supérieure et borne inférieure 
d’un ensemble 


Si l’ensemble avec lequel on opère est celui des nombres réels, 
on peut comparer les éléments de cet ensemble au point de vue de 
leur grandeur. Assez souvent, il devient alors nécessaire de voir quel 
élément de l’ensemble est le plus grand ou le plus petit. Pour un 
ensemble fini le problème n’est pas difficile. Ainsi, pour l'ensemble 
T = {3,4,5,6} min T = 3, max T7 = 6. Il en est quelquefois autre- 
ment pour des ensembles infinis. 
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Soient À l'ensemble de tous les nombres réels, et S$ = {zx € R: 
m<zxz< M}. L'ensemble S, représentant un segment non fermé 
de l'axe réel, n’a ni plus grand ni plus petit élément. Cependant, il 
est possible qu'un ensemble de ce type ait des bornes: ce seront dans 
notre cas les nombres m et M qui, étant ajoutés à l’ensemble S, 
le complètent jusqu’à un segment fermé. Le point M porte le nom 
de supremum de S$, M — sup S, et le point m porte le nom d’infimum 
de $, m = inf S. 

Théorème 1-1 (théorème de la borne supérieure et de la borne 
inférieure d’un sous-ensemble). Si B <« À, alors 


inf B>inf A; sup B< sup À. (1-6) 


Démonstration. Soit b” le plus petit élément de B, de 
sorte que b” € B et b’ — inf B. Or, B © À, ce qui fait que b° € À. 
Soit a’ un élément de À tel qu'il ait la valeur la moins élevée, en 
sorte que a’ € À et a’ — inf 4. Dans ce cas, si b’ — a’, on a b" — 
= inf 4; si ba’, on a b > a’ — inf À. Ainsi donc, b’ > inf À 
ou inf B > inf À. 

On démontre de façon analogue la seconde assertion du théorème. 
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a) Considérations préliminaires 


Les ensembles se prêtent à des opérations qui rappellent beau- 
coup les opérations d’addition et de multiplication en algèbre élé- 
mentaire. Pour mieux comprendre les opérations effectuées sur les 
ensembles, il est nécessaire de se rappeler les lois régissant l'algèbre 
élémentaire. 

Soient a et b deux nombres, a + b leur somme et ab leur produit. 
La somme et le produit possèdent certaines propriétés, appelées 
aussi lois d’algèbre: | 

4 a+b—b+a; ab — ba. C'est la loi commutative. 

2. (a+b)+c—=a<+(b+c); (ab)c— abc). C'est la loi 
associative. 

3. (a+b) c—ac<+bc. C'est la loi distributive. 

Notons qu'en ce qui concerne les lois associative et commutative, 
il est possible de substituer la multiplication à l'addition, et vice 
versa. On aura obtenu une autre loi, tout aussi valable que la 
première. Par contre, la loi distributive ne permet pas une symétrie 
pareille. Substituant dans cette loi la multiplication à l'addition 
et l'addition à la multiplication, on donnerait lieu à une absurdité : 


(ab) + c = (a + c) (b + oc). 


En est-il toujours ainsi? N'’existe-t-il pas d'’algèbre telle que la 
loi distributive soit tout aussi symétrique par rapport à l'addition 
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et à la multiplication que les lois commutative et associative? 
Il se trouve que l'algèbre en question existe : c’est l'algèbre des en- 
sembles, en laquelle toutes les trois lois sont symétriques par rapport 
aux opérations d'addition et de multiplication. 

La ressemblance entre les opérations d’addition et de multipli- 
cation se manifeste également dans l'existence de deux nombres 
0 et 1 remarquables dans ce sens que tout nombre additionné au pre- 
mier et multiplié par le deuxième reste inchangé: 


a+0—a, a-1 = a. 


; Remarquons que la seconde relation se déduit de la première 
pour peu qu'on change (+) en (-) et O en 1. 

Or, ici encore, l’analogie entre les opérations d’ addition et de 
multiplication ne va pas trop loin. C’est ainsi que le nombre 0 joue 
un rôle assez particulier par rapport à tous les autres nombres, 
y compris l'unité. Ce rôle particulier du nombre O0 découle de la 
relation a-0 — 0. Remplaçant dans cette relation (+) par (+) et 0 
par 1, on aboutit à la relation a + 1 — Î, qui ne se vérifie presque 
jamais. 

On verra par la suite qu’en algèbre des ensembles la ressemblance 
entre le zéro et l'unité est sensiblement plus grande qu’en algèbre 
classique. 

Ces remarques préliminaires faites, passons à l’étude des opéra- 
tions effectuées sur les ensembles. 


b) Réunion d’ensembles 


On entend par réunion de deux ensembles X et Y l’ensemble cons- 
titué par les éléments et seulement par les éléments qui appartiennent 
au moins à l’un des ensembles X, Ÿ, c.-à-d. soit à X, soit à Y. La 
réunion de X et de Ÿ se désigne comme suit: X{[J Y. La définition 
formelle est 


zEXUYÆ2zeX ou rer. (1-7) 


On donne parfois à la réunion de deux ensembles le nom de somme 
de deux ensembles et on la désigne par X + Y. Or, les propriétés 
de la réunion sont quelque peu différentes de celles d’une somme 
arithmétique ordinaire. Aussi évitera-t-on l'usage de ce terme. 


Exemple 1-1. Si À (1, 2, 3, 4, 5} et Y = {2, 4, 6, 7}, alors X U Y = 

= {1, 2, 3, 4,5, 6, 

Eremple 1-2. Si X et l’ensemble des étudiants du groupe qui ont toutes les 
notes excellentes, et Ÿ , l’ensemble des étudiants habitant le foyer, alors X (J Y 
est l'ensemble des étudiants qui ou bien ont toutes les notes excellentes, ou 
bien habitent le foyer. 

Exemple 1-3. Considérons deux cercles (fig. 1-1). Si X est l’ensemble des 
points du cercle de gauche, et Ÿ, celui du cercle de droite, alors XUY 
représente le domaine hachuré limité par les deux cercles. 
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La notion de réunion peut être étendue à un nombre plus grand 
d'ensembles. Désignons par Mt — {X,, ..., X,} la collection de 
n ensembles X,, ..., X,, dite parfois système d'’ensembles. La 
réunion de ces ensembles 


Ü Xi= VU, X=XiU...UXA (1-8) 
i=1 XEM 


représente un ensemble, constitué par les éléments et seulement par 
les éléments qui appartiennent au moins à l’un des ensembles faisant 
partie du système j)j}. 

Les réunions d’ensembles vérifient les lois commutative et 
associative 


X Y 
XUY=YUX; (1-9) 
(XUY)UZ=XU(YUZ)=XUYUZ, (1-10) 
ce qui découle du fait que les premiers et les 
deuxièmes membres des équations se composent des | 
mêmes éléments. Ensuite, Fig. 1-1. Réu- 
nion de deux 
XUG=X. (1-11) ensembles 


Cette relation est aussi évidente, car un ensemble vide ne con- 
tient point d'éléments; donc, X et X [| Z contiennent les mêmes 
éléments. On voit de (1-11) que l’ensemble vide @ joue le rôle de 
zéro en algèbre des ensembles. L'expression que l’on vient de consi- 
dérer est analogue à l'expression a + O0 = a propre à l'algèbre clas- 
sique. 


c) Intersection d’ensembles 


On entend par intersection de deux ensembles X et Y l’ensemble 
constitué par les éléments et seulement par les éléments dont chacun 
appartient en même temps à X et à Y. L’intersection des ensembles X 
et ŸY se désigne par X NY. La définition formelle est 


zEXNAYÆzEexX et xey. (1-12) 


Parfois, on désigne l'intersection de deux ensembles sous le 
terme de produit de deux ensembles et on la représente par le sym- 
bole XY. Or, les propriétés de l'intersection sont quelque peu diffé- 
rentes de celles d’un produit arithmétique ordinaire. Aussi évitera- 
t-on l’usage de ce terme. 


Exemple 1-4. Pour les ensembles X et Y de l'exemple 1-1 on a X NY = {2,4}. 

Exemple 1-5. Pour les ensembles X et Y de l’exemple 1-2 on a X AN Y pour 
désigner l’ensemble des étudiants du groupe n'ayant que des notes excellentes 
et habitant le foyer. 
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Eremple 1-6. Considérons deux cercles représentés sur la figure 1-2. Si X 
est l’ensemble des points du cercle de gauche et Y, celui du cercle de droite, 
l'expression X f\ Y désigne le domaine hachuré qui représente la partie commune 
des deux cercles. 


L'opération d'intersection permet d'établir plusieurs relations 
entre deux ensembles. 

On dit que les ensembles X et Y sont disjoints s'ils n’ont aucun 
élément commun, en sorte que 


XxnY=g. (1-13) 


Exemple 1-7. On considère comme ensembles disjoints: 
1) les ensembles {1, 2, 3} cet {4, 5, 6}; 
2) l'ensemble des étudiants du groupe qui ont toutes les notes excellentes 
et l’ensemble des étudiants qui ont les mauvaises notes; 
3) les ensembles des points des cercles X et Y représentés sur la figure 1-3. 


X Y x Y 
Fig. 1-2. Intersec- Fig. 1-3. Ensembles dis- 
tion de deux enscm- joints 
bles 


On dit que les ensembles X et Y se rencontrent s’ils vérifient 
trois conditions: 

il existe dans X un élément qui n’appartient pas à Ÿ ; 

il existe dans Ÿ un élément qui n'appartient pas à X; 

il existe un élément appartenant aussi bien à X qu’à Y. 

Soulignons une particularité de l'algèbre des ensembles relati- 
vement à celle des nombres. Deux nombres a et b peuvent être liés 
l’un à l’autre par trois relations, ou possibilites : 


a<b,a—=b, b<a. (1-14) 


Par contre, deux ensembles X et Ÿ peuvent être tels que des trois 
relations 


XCY, X=Y, Yex (1-15) 


aucune ne sera vérifiée. C’est ainsi que si X est l’ensemble des étu- 
diants qui ont toutes les notes excellentes, et Y, l’ensemble des étu- 
diants habitant le foyer, la signification des trois relations citées 
sera la suivante: 

X< Ÿ, chaque étudiant qui a toutes les notes excellentes habite 
obligatoirement le foyer; 

X = Ÿ, tous les étudiants qui ont toutes les notes excellentes, 
et seulement les étudiants de cette catégorie, habitent le foyer; 
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Y« X, tous les étudiants habitant le foyer ont toutes les notes 
excellentes. 

De toute évidence, ces relations n’englobent pas toutes les pos- 
sibilités. En réalité, comme il découle des définitions données plus 
haut, deux ensembles X et Y peuvent être liés l’un à l’autre par 
l'une des cinq relations suivantes: 


X=Y, XcCcY;, Y<exX; XfNY=@; 


X et Y se rencontrent. 

La notion d’intersection peut être étendue à un nombre plus grand 
d'ensembles. Prenons un système d’ensembles M — {X,, ..., X,}. 
L’intersection de ces ensembles s’écrit sous la forme 


n X=N Xi=XiN..NXn (146) 
XcTR i—{ 


et représente un ensemble dont les éléments appartiennent à chacun 
des ensembles faisant partie de ÿh. 

Il est facile de voir que l'intersection d’ensembles est commu- 
tative 


XNY=Y"NXx (1-17) 
et associative 
(XNY)NnZ=xXNrN2=xNnYNz. (1-18) 
Remarquons par ailleurs qu'il est légitime d'écrire 
XND=S, (1-19) 


relation analogue à la relation a -0 — 0 de l'algèbre classique. La 
relation (1-19), considérée conjointement avec la relation (1-11), 
montre que l’ensemble vide remplit la fonction de 
zéro en algèbre des ensembles. 


d) Différence d’ensembles 71 


Cette opération, à la différence de celles de réunion | . 
et d’intersection, ne vaut que pour deux ensembles. Fi£- 14 Ditié- 
On entend par différence de deux ensembles X et Y Tncembles — 
l’ensemble constitué par les éléments et seulement par 
les éléments qui appartiennent à X et n’appartiennent pas à Y. 
Elle est désignée par XX Y. Ainsi donc, 


IEXNYEZEX; ré. (1-20) 


Exemple 1-8. Pour les ensembles X et Y de l’exemple 1-1 on a X X Y = 
= {1,3,5}, Y  X = {6,7}. Si X et Y sont les ensembles de l’exemple 1-2, 
alors X NX Y est l’ensemble des étudiants qui ont toutes les notes excellentes 
et n’habitent pas le foyer. Pour X et Y de l'exemple 1-3, X X Y est le domaine 
bhachuré de la figure 1-4. 


X Ÿ 
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e) Ensemble universel 


Comme on vient de le voir, le rôle de zéro en algèbre des ensembles 
est joué par l’ensemble vide. Une question se pose de savoir s’il 
existe un ensemble 7 tel qu'il puisse remplir la fonction de l'unité, 
c.-à-d. vérifier la condition 


Xni=X, (1-21) 


analogue à la condition a-1 = a de l'algèbre classique. 

La relation (1-21) veut dire que l’intersection, ou « partie com- 
mune », de l’ensemble Z et de l’ensemble X pour tout ensemble X 
se confond avec cet ensemble lui-même. Or, cela n’est possible 
que si l’ensemble JZ contient tous les éléments constitutifs de l'ensem- 
ble X, de sorte que tout X est intégralement inclus dans 7. L'ensem- 
ble Z vérifiant cette condition s'appelle achevé, ou universel, ou 
unilaire. 

Compte tenu de ce qui précède, on définit l’ensemble universel 
comme suit. Si une considération donnée ne porte que sur des sous- 
ensembles d’un certain ensemble fixé 7, ce dernier ensemble J. 
le plus grand de tous, porte le nom d'ensemble universel. 

Il est à noter que le rôle de l’ensemble universel peut être joué 
par des ensembles différents, selon le cas. Ainsi, quand on considère 
divers ensembles des étudiants du groupe (étudiants qui ont toutes 
les notes excellentes ; étudiants qui touchent la bourse; étudiants 
qui habitent le foyer, etc.), c’est l’ensemble des étudiants du groupe 
qui se présente comme ensemble universel. 

Il est commode de représenter graphiquement l'ensemble uni- 
versel sous la forme de l’ensemble des points d’un rectangle. Cer- 
tains domaines à l’intérieur de ce rectangle représenteront alors 
divers sous-ensembles de l’ensemble universel. Le dessin représentant 
les ensembles sous la forme de domaines à l’intérieur d’un rectangle 
assimilé à l’ensemble universel est connu sous le nom de diagramme 
d’'Euler-Venn. 

L'ensemble universel possède une propriété remarquable, qui 
n’a pas son analogue en algèbre classique, à savoir, pour tout ensem- 
ble /X on a la relation 


XUI=I. (1-22) 


En effet, la réunion X |) Z est un ensemble contenant aussi bien 
tous les éléments de X que tous les éléments de 7. Or, l’ensemble 
I contient a priori tous les éléments de X, de sorte que X [J Z con- 
tient les mêmes éléments que Z et représente donc l’ensemble uni- 
versel 7 lui-même. 
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f) Complémentaire d’un ensemble 


Un ensemble X défini par la relation 
X=IXX (1-23) 


est dit complémentaire de l’ensemble X par rapport à (ou dans) l’en- 


semble universel Z. Sur le diagramme de la figure 1-5 l’ensemble X 
représente la partie non hachurée. La dé- 


finition formelle est : _ I 
X={z:r€l et ré X}. 
Exemple 1-9. Si 1 = {1, 2,3, 4, 5, 6, 7} ct x 
X = 43,5, 7}, alors X — {1, 2, 4, 6}. | 
Il vient de (1-23) que X et X n’ont pas L - —— 


d’élément commun, de sorte que Fig. 1-5. Complémentaire 
x" X— G. (1-24) d’un ensemble 
En outre, il n'existe pas d'élément de Z tel qu'il n'appartienne 
soit à X, soit à X, car les éléments n'appartenant pas à À appartien- 
nent forcément à X. Donc, 
XUX=I. (1-25) 
La symétrie de la formule (1-25) par rapport à X et X signifie 
non seulement que X est complémentaire de À mais aussi que À 
l'est de X. Or, le complémentaire de X est X. On a donc 
X=X. (1-26) 
A l'aide du complémentaire, on réussit à représenter sous une 
forme commode la différence de deux ensembles 
XXY ={r:7EX et réY}={r:zCX et rEY}, 
c.-à-d. 
XXY=xnNY. (1-27) 


£g) Partition d’un ensemble 


Une des opérations effectuées très souvent sur les ensembles est 
la partition d'un ensemble en un système de sous-ensembles. Par 
exemple, le système de promotions dans le cadre de la faculté donnée 
est une partition de l'ensemble des étudiants de la faculté ; le sys- 
tème de groupes de la promotion est une partition de l’ensemble des 
étudiants de la promotion. Si N est l’ensemble des nombres naturels 


32 CH. 1. NOTIONS ESSENTIELLES DE LA THÉORIE DES ENSEMBLES 


et À,, À;, les ensembles des nombres pairs et impairs, le système 
{A,, A,} constitue une partition de V. On peut partager l’ensemble 
des nombres naturels d’une autre façon, par exemple en ensembles 
des nombres divisibles par 3 sans reste; avec reste 1 ; avec reste 2. 
La production d’une entreprise est partagée en un système d'’en- 
sembles constitués par les produits de première qualité, ceux de 
seconde qualité et le rebut. Le nombre d'exemples analogues pourrait 
être multiplié à l'infini. 

Pour donner à la notion de partition une définition rigoureuse, 
considérons un ensemble et un système d’ensembles YNè — 
— {X,,..., X,}. On dit que le système d’ensembles M est la 
partition de l’ensemble M s'il satisfait aux conditions suivantes: 

1) tout ensemble X de Y est sous-ensemble de M : : 


VXEMN:XS=M; (1-28) 
2) deux ensembles quelconques X et Ÿ de sont disjoints: 
VXEM, VY'EM X£ÆY--XNrY =; (1-29) 


3) la réunion de tous les ensembles faisant partie de la partition 
forme l’ensemble M: 


U X=M. (1-30) 
XEM 


Nous reparlerons de la partition à propos de la relation d’équi- 
valence, qui est étroitement liée à la première. 


h) Identités en algèbre des ensembles 


Les opérations de réunion, d'intersection et la notion de complé- 
mentaire permettent d'écrire différentes expressions algébriques 
à partir d’ensembles. Désignons par A(X, Ÿ, Z) une expression 
algébrique composée par les ensembles X, Y et Z. Cette expression 
est elle-même un ensemble. Soit S(X, Ÿ, Z) une autre expression 
algébrique composée par ces mêmes ensembles. Si les deux expres- 
sions algébriques représentent un seul et même ensemble, on peut 
les identifier: nous obtenons alors une identité algébrique de la 
forme 


AUX, Y, Z)=DUX, Y, 2). (1-31) 


De tels ensembles sont d'une grande utilité lorsqu'il s’agit de 
transformer des: expressions algébriques écrites au moyen d’ensem- 
bles; nous allons considérer quelques ensembles de ce type. 

4. Sur la figure 1-6 sont représentés les diagrammes d’Euler et 
Venn pour les expressions (XUY)NZ et (XNZ)U(Y NZ). On voit 
sur ces diagrammes que les deux expressions définissent un seul et 
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même ensemble, de sorte qu’en algèbre des ensembles a lieu l'identité 
(XUY)NnZ=(XNZ2)U(YN2), (1-32) 


analogue à la loi distributive (a + b) c — ac + bc propre à l'algèbre 
classique. 


Fig. 1-6. Illustration géométrique de l'identité (XUY)NZ = (XNZ)U 
U(YN2) 


2. Nous ne pouvons, en algèbre classique, remplacer dans la loi 
distributive l'addition par la multiplication et vice versa, au risque 
d'obtenir une expression absurde (ab) + c — (a + c) (b + c). Il 
en est tout autrement en algèbre des ensembles. 


Fig. 1-7. Illustration géométrique de l'identité (X AN Y)UZ = (XUZ)N(YU2) 


On voit sur la figure 1-7 les diagrammes d’Euler et Venn pour 
les expressions”algébriques (X NAY)UZ et (XUZ)N(Y UZ). Les deux 
expressions conduisent à un seul et même ensemble. On a donc 
l'identité 


(XNY)UZ=(XUZ) NY U2). (1-33) 
3. On vérifie facilement que si Ÿ = X, alors 
XNY=Y, XUY=X. (1-34) 


En effet, tous les éléments de l’ensemble Ÿ sont en même temps 
éléments de l’ensemble X. Donc, l'intersection de ces ensembles, 
c.-à-d. la partie commune de X et Ÿ, se confond avec Y. La contri- 
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bution apportée par l’ensemble Ÿ à la réunion des ensembles X et Y 
ne contient pas un seul élément nouveau, celui-ci étant déjà, for- 
cément, élément de X. Par conséquent, X |J Ÿ se confond avec X. 
4. Posant dans (1-34) Y — X et se rappelant que X = X, on 

trouve : 
XNX=X, XUX—=X. (1-35) 


La démonstration des identités en algèbre des ensembles au 
moyen des diagrammes d’Euler et Venn s'avère quelquefois incom- 
mode. Il y a un moyen plus général de démonstration de l'identité 
de deux expressions algébriques. 

Désignons, comme auparavant, par À (X, Y, Z) et À (X, Y, 2) 
deux expressions algébriques formées à partir des ensembles X, Y 
et Z par application de la réunion, de l'intersection et du complémen- 
taire. Pour démontrer que À = Ÿ, il suffit de montrer que A = $ 
et que * © %. D'autre part, pour montrer que A = $, il faut 
que EX implique zE *. De façon analogue, pour démontrer 
que $ = Y, il faut s'assurer que x € À implique x E À. Procédons 
par cette méthode et démontrons encore quelques identités. 

9. Démontrons l'identité 


XUY=xNrY. (1-36) 


Supposons que zE£E XUY, c.-à-d. que zé X LU Y. Cela revient 
à direquezé XetzéY, c.-à-d. que x € X et x € Y. Par conséquent, 
zEX NY. Supposons maintenant que yE XNŸY, c.-à-d. que 
yE XetyE Ÿ. Cela signifie queyéXety &Y,c.-a-d. quey é XUY. 
Donc, yE XUY. 
6. Démontrons l'identité 
XNY=XUY (1-37) 
en mettant ses deux membres sous une forme identique. Cherchant 
les complémentaires des deux membres de (1-37), on obtient X (\Ÿ — 


= XUY. Le premier membre devient XfN\Y. On obtient la même 
expression du second membre en le transformant d’après (1-36). 

Dans les ouvrages mathématiques, les identités (1-36) et (1-37) 
sont appelées d'habitude identités de Morgan. 


1-3. MISE EN ORDRE DES ÉLÉMENTS. 
PRODUIT DIRECT D’'ENSEMBLES 


a) Ensemble ordonné 


À côté de la notion d'ensemble comme collection d'éléments, 
il existe une notion fort importante d'ensemble ordonné, ou cor- 
tège. On entend par cortège une suite d'éléments, c.-à-d. une collec- 
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tion d'éléments organisée de telle façon que chaque élément y occupe 
une place déterminée. Les éléments eux-mêmes sont désignés alors 
sous le terme de composantes du cortège: première composante, 
deuxième composante, et ainsi de suite. Voici quelques exemples de 
cortèges: l’ensemble des personnes formant une file d'attente, ou 
queue; l’ensemble des mots d’une phrase; les nombres définissant 
la longitude et la latitude d'un point sur le terrain, etc. Dans tous 
ces ensembles la place de chaque élément est parfaitement détermi- 
née et ne peut être changée arbitrairement. 

Le nombre des éléments formant un cortège est la longueur de 
celui-ci. Pour désigner un cortège, nous utiliserons les parenthèses. 
Ainsi, l’ensemble 


a = (a, a, ..., an) (1-35) 


est un cortège de longueur nr et d'éléments a,;, .…., a,. Les cortèges 
de longueur 2 sont appelés couples ou couples ordonnés; ceux de lon- 
eueur 3, friplets; ceux de longueur 4, quadruplets, etc. Dans le cas 
général, un cortège de longueur 7 est un n-uplet. Des cas particuliers 
d'un cortège sont le cortège (a) de longueur 1 et le cortège vide de 
longueur O0, désigné par ( }) ou par A. A l'opposé d’un ensemble 
ordinaire, le cortège peut contenir des éléments identiques: deux 
mots identiques dans la phrase, mêmes valeurs numériques de longi- 
tude et de latitude d’un point sur le terrain, etc. 

Dans le texte qui suit, nous allons considérer des ensembles 
ordonnés qui ont pour éléments des nombres réels. Les ensembles 
ordonnés de ce type sont appelés points de l'espace ou vecteurs. C'est 
ainsi que le cortège (a,;, a.) peut être considéré comme un point sur 
le plan, ou bien comme un vecteur allant de l'origine des coordon- 
nées au point donné (fig. 1-8,a). Les composantes a, et a, deviendront 
les projections du vecteur sur les axes Z et 2 


Pr (Gus Ge) = 3 Pre (@y, Ge) = @o. 
Le cortège (a,, a, a:) peut être considéré comme un point dans 
l'espace à trois dimensions, ou bien comme un vecteur tridimension- 


nel reliant l'origine des coordonnées au point en question (fig. 1-8,b). 
Les projections du vecteur sur les axes de coordonnées sont 


Pr (a, do, az) = dj, = 1, 2, 3. 


Cependant, dans le cas donné, on peut parler de la projection du 
cortège simultanément sur deux axes, disons Z et 2, c.-à-d. sur le 
plan de coordonnées. Il est facile de voir que cette projection repré- 
sente un cortège à deux éléments 


Pris (Gi, Ge, A3) = (ai, @2). 


Généralisant ces notions, assimilons un ensemble ordonné de 
nombres réels à x éléments (a, . .., a,) à un point dans un espace 


* 


imaginaire à nr dimensions (dit parfois hyperespace), ou bien à un 
3% 
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vecteur à z dimensions. Les composantes du cortège a à nr éléments 
seront considérées alors comme les projections de ce cortège sur les 
axes correspondants : 


Pa = &, i=1,...,n. (1-39) 
Numérotant les axes par ë, j, ..., L defaçonquei<i<j<... 
J 


IC AT 


dr 7 _____ù LL” 
1 b) (Oy, Gp) 


Fig. 1-8. Projections de cortèges à deux et à trois éléments 


... <l<n, on obtient la projection du cortège a sur les axes 
. J + +, L sous la forme 


Pri,5,...,14— (a;, Œj, +... a}). (1-40) 


La projection du cortège sur un ensemble vide des axes est le 
cortège vide 
pProa — À. (1-41) 


C'est au chapitre 3 que l’on trouve une définition plus complète 
et plus rigoureuse de l’espace multidimensionnel. 


b) Produit direct d’ensembles 


On entend par produit direct de deux ensembles X et Y l'ensemble 
(noté X X Ÿ) constitué entièrement et seulement par les couples 
ordonnés dont la première composante appartient à ÆX et la 
deuxième à Ÿ. Ainsi donc, les éléments de l’ensemble ordonné sont des 
cortèges à deux éléments de la forme (x, y). La définition formelle est 


XXY={(z v):TEX, yeY}. (1-42) 


Exemple 1-10. Soient X = {1, 2}, Y — {1, 3, 4}. Alors X X Y — {(1,1), 
(1,3), (1,4), (2,1), (2,3), (2,4)}. La représentation géométrique de cet ensemble 
est donnée sur la figure 1-9, a. 

Exemple 1-11. Soient X et Y des segments de l’axe réel. On représente le 
produit direct X X Y par un rectangle (hachuré sur la figure 1-9, b). On peut 
voir du dessin que les propriétés du produit direct diffèrent de celles d’un produit 
arithmétique ordinaire. En particulier, le produit direct est sensible à la per- 


mutation de ses facteurs: 
XX YÆYX X. (1-43) 
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La notion de produit direct s'étend sans difficulté à un plus 
grand nombre d'ensembles. On entend par produit direct des ensem- 
bles X,, X2, ..., X, l’ensemble noté X,; X X, X ... x X, et cons- 


Fig. 1-9. Illustration géométrique du produit direct de deux ensembles 


titué entièrement et seulement par les cortèges de longueur: r, 
dont la première composante appartient à X,, la deuxième à X,, 
et ainsi de suite. 

On s’assure facilement que 


XXY=GEX=-G où Y=®, (1-44) 


puisqu'il n’y a pas de couple ordonné amputé de sa première ou de 
sa deuxième composante. Par analogie, X, X X, X ...XX, = © 
si et seulement si au moins un des ensembles X,, X:, ..., X, 
est vide. 

Un cas particulier du produit direct est la puissance d'un ensemble. 
Soit donné un ensemble quelconque M. On désigne par s-ième puis- 
sance de W (notation W°) le produit direct de s ensembles identiques 
égaux à 7: 


M=MXxXMX...xM. (1-45) 
s fois — 


Cette définition vaut pour s — 2, 3, ... On l’étend à un s entier 
non négatif quelconque en spécifiant que 


M =M, M = {A} (1-46) 


Si À est l’ensemble des n ombres réels, alors R? = R X R est 
le plan réel, et R° — R X R X R l'espace réel tridimensionnel. 


c) Projection d’un ensemble 


La projection d’un ensemble, étroitement liée à celle d’un cortège, 
n'existe que pour les ensembles dont les éléments sont constitués 
par des cortèges de même longueur. 
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Soit M un ensemble constitué par des cortèges de longueur s. 
Sa projection sera représentée alors par l’ensemble des projections 
des cortèges de M. 


Exemple 1-12. Soit M = {(1, 2, 3, 4, 5), (2, 1, 3, 5, 5), (3, 3, 3, 3, 3), 
(3, 2, 3, 4, 3)}. Alors 


pre M =1{2, 1, 3}; pro, M—1{(2, 4), (1, 5), (3, 3);. 
On vérifie sans peine que si M — X X Ÿ, alors 


pruM = X; preM =Y, (1-47) 
et si Q=X x YŸ, alors 
pnOSsXxX; pnQsry. (1-48) 


1-4. CORRESPONDANCES 


a) Définition d’une correspondance 


Considérons deux ensembles X et Ÿ. On peut faire correspondre 
les éléments de ces ensembles, d’une façon ou d’une autre, les uns 
aux autres, en sorte qu'ils forment des couples (x, y). Si le mode de la 
correspondance est défini, c.-àa-d. si l’on connaît pour tout x € X 
l'élément y € Y auquel on fait correspondre x, on dit qu’il y a cor- 
respondance entre X et Y {8, 11]. Remarquons qu'il n’est absolument 
pas indispensable que la correspondance porte sur la totalité des 
éléments des ensembles X et Y. 

Pour définir une correspondance, il faut que l’on connaisse: 

1) l’ensemble X dont les éléments sont censés correspondre à ceux 
d'un autre ensemble; 

2) l'ensemble Y aux éléments duquel on fait correspondre les 
éléments d’un premier ensemble : 

3) l’ensemble Q = X X Y définissant la loi conformément 
à laquelle se réalise la correspondance, c.-à-d. l’ensemble énumérant 
tous les couples (x, y) faisant partie de la correspondance. De cette 
façon, la correspondance, désignée par q, représente un triplet d’en- 


sembles 
q = (X, Y, Q) (1-49) 


dans lequel Q = X X Y. Dans cette expression la première compo- 
sante X est dite ensemble (ou domaine) de départ, la deuxième compo- 
sante Ÿ ensemble d'arrivée, la troisième composante Q graphique de la 
correspondance. Le terme « graphique » sera expliqué plus en détail 
au cours de l’étude d'une forme particulière de la correspondance qui 
porte le nom de fonction. 

En plus des trois ensembles considérés X, Ÿ et Q, à chaque cor- 
respondance sont étroitement liés encore deux ensembles, à savoir: 
l’ensemble pr,Q, dit ensemble de définition, qui comprend les éléments 
de X faisant partie de la correspondance, et l’ensemble pr.,Q, dit 
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ensemble de valeurs, qui réunit les éléments de Y faisant partie de la 
correspondance. 

Si (x, y) E Q, on dit que y correspond à x. La correspondance se 
représente géométriquement, d’une façon très commode, par une 
flèche allant de x vers y. 


Exemple 1-13. Soient X = {1,2}, Y — {3,5}, de sorte que X X Y — 
— {(1,3), (1,5), (2,3), (2,5)}. Cet ensemble donne lieu à 16 correspondances 
différentes. Citons-en quelques-unes : 


Qi = {(1,3)}; prniQ = {1}; preQ = (}; 
Qz2 {(1:3), (1,5)}; priQ2 = (1}3 preQe = {3,5} = Y.. 

Exemple 1-14. L'entreprise dispose de trois véhicules: deux camions «& et $ 
utilisés en deux relèves et un autocar y qui est rarement utilisé. Le camion $ est 
en réparation. L'entreprise emploie 
trois chauffeurs: a, b et c, dont a p,) C0 a ce 
c est en vacances. L'affectation des O O 
chauffeurs aux véhicules est une 
correspondance. Une des correspon- 
dances possibles sera : 


O 
q — ({a, b, c}, (a, B, Y} {(a, œ), Le 4 À Y a 2 y 
(a, y), (b, æ)}). 
_ a) ÿ 
La représentation géométrique 


de cette correspondance est donnée Fig. 1-10. Représentation géométrique 
sur la figure 1-10, à. L'élément a des correspondances directe et inverse 


4 correspond aux éléments a et b, 
tandis que l'élément y correspond à a. La correspondance q est définie sur a et 


b mais non sur c; donc, l’ensemble de définition est {a, b}. L'ensemble de 
valeurs est {&, y}. 


b) Correspondance inverse 


Pour toute correspondance qg = (X, Y, Q), Q=X X Y il existe 
la correspondance inverse que l'on obtient en considérant la cor- 
respondance donnée dans le sens inverse, c.-à-d. en déterminant les 
éléments x € À auxquels on fait correspondre les éléments y € Y. 
La correspondance inverse de q sera désignée par 


g'=(Y, X, Q71), (1-50) 
où Q1aY x X. 


vw 


Exemple 1-15. Dans les conditions de l'exemple 1-14 la correspondance inver- 
se est l'affectation des véhicules aux chauffeurs 


({æ, B, v} {a, b, c} {(œ, a), (æ&, b), (y; a)}) 
représentée géométriquement sur la figure 1-10, b. 
L'exemple considéré laisse voir que l’on obtient la représentation 


géométrique de la correspondance inverse en changeant la direction 
des flèches dans la représentation géométrique de la correspondance 
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directe. I] s'ensuit qu’une correspondance inverse a pour son inverse 
la correspondance directe: 


= 9. (1-51) 


c) Composée des correspondances 


On entend par composée des correspondances, deux correspondances 
écrites l’une après l’autre. 

La composée des correspondances est le résultat d'une opération 
effectuée sur trois ensembles X, Y et Z sur lesquels sont définies deux 
correspondances 


g=(X,Y,0Q), Q=xXxY; | 
p=(r,Z. P), PSY X2, 


l'ensemble de valeurs de la première correspondance coïncidant avec 
l’ensemble de définition de la seconde 


preQ = prP. (1-53) 


La première correspondance définit pour tout xEprQ un 
élément, peut-être non unique, y € Y. Conformément à la défini- 
tion de la composée des correspondances, on doit/maintenant définir 
pour y € Ÿ trouvé, en employant la seconde correspondance, l'élé- 
ment z2 € Z. Ainsi donc, la composée des correspondances fait cor- 
respondre à chaque élément x de l’ensemble de définition de la pre- 
mière correspondance pr,;Q un ou plusieurs éléments z de l’ensemble 
de valeurs de la seconde correspondance pr.P. 

Désignons la composée des correspondances qg et p par gq (p), 
et le graphique de la composée des correspondances, par Qc P. 
La composée des correspondances (1-52) s'écrit alors sous la forme 


g(p}=(X, 2, QoP), QCPEXXZ. (1-54) 


Exemple 1-16. Si q est la correspondance définissant l'affectation des chauf- 
feurs aux véhicules et p celle définissant l'aficctation des vébicules aux 
itinéraires, la correspondance g(p) définira l’affcctation des chauffeurs aux 
itinéraires. 


(1-52) 


Il est naturel que la composée s’étende sans difficulté à plus de 
deux correspondances. 


1-5. APPLICATIONS ET FONCTIONS 


a) Applications et leurs propriétés 


Soient donnés deux ensembles X et Y et, d'autrepart, FE XX Y 
de sorte que pr,l — X. Le triplet d’ensembles (X, Y, l') définit une 
certaine correspondance, remarquable par ailleurs par le fait que 
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son ensemble de définition pr,l coïncide avec l’ensemble de départ, 
c.-à-d. avec X et que, par conséquent, la correspondance en question 
est partout définie sur X. En d'autres termes, pour tout x E{X 
il existe un y € Y tel que (x, y) € l. Une telle correspondance partout 
définie porte le nom d'application de X dans Y et s'écrit 


T'EX —+ Y. (1-55) 
Très souvent, en employant le*mot « application », on sous- 


entend une application univoque. Ce ne sera pas pourtant notre 
principe: nous admettrons qu’une application 


fait correspondre à tout élément x € À un certain , b 
sous-ensemble 
Tree, (1-56) D, 
re . ) 
appelé image de x. La loi régissant la correspon- à À ÿ 


dance est définie par l’ensemble T. 
Fig. 1-11. Repré- 

Eremple 1-17. Si dans l'exemple 1-14 ‘on ne prend pas Sentation  géo- 

en considération le chauffeur c, on obtientl l'application métrique de 
:X —+ Y dans laquelle X = {a, b} est l’ensemble des l'application 

chauffeurs; Y — {x, B, y} l’ensemble des véhicules; T — 
= {(a, «), (a, y), (b, &)} l'affectation des chauffeurs aux véhicules. La représen- 
tation géométrique de cette application est donnée sur la figure 1-11. 


Considérons quelques propriétés de l'application. Soit À = X. 
Pour tout x € À l’image de zx sera l’ensemble Tr & Y. La totalité 
des éléments de Ÿ, images lzx pour tous les x € À, sera appelée image 
de l’ensemble À et notée TA. En vertu de cette définition 


TA= | Lx. (1-57) 
XCA 
Si 4, et À, sont sous-ensembles de X, on a 
A (4; U A3) —= r'A, U V0. (1-58) 
En effet, 
(AU A4+)= U Fr=(U FrU(U Fr) = FA; UTAe. 
x=A1l'Ao xe A: xE As 


Cependant, la relation 
F (4: fN 42) = FA: FA» (1-59) 


ne se vérifie que si l’application est univoque. Pour le démontrer, 
procédons à la partition des ensembles À, et 4, (fig. 1-12) de la forme 


Ai =XiUXo A2=XeU X0 


où X0 — À; N À 2. 

Les ensembles X,, X., X, representent alors une partition de 
l’ensemble À,1JA4:. Bien que ces ensembles n'aient pas d'éléments 
communs, leurs images peuvent en comporter quand l'application 


42 CH. 1. NOTIONS ESSENTIELLES DE LA THÉORIE DES ENSEMBLES 


est non univoque. Donc, 
VAN FAe = (Xi U Xo) NT (Xe U Xo) = 
=(rxin 'X2) U(ŒxXiN 'X0) U(TX2N PXo) U l'X0- 
De cette relation on voit que (1-59) ne se réalise que lorsque 
FX; NTXr=@; i,kE({O,1,2}; ik, (1-60) 


c.-à-d. quand l'application est univoque. Par contre, dans le cas 
général on a 


lXo=T (ANA) STA NA. (1-61) 


Ces relations s'étendent facilement à un plus grand nombre de 
sous-ensembles À;. Par exemple, si À,, ..., À, sont sous-ensembles 


de X, alors 

À; A? n n 
è CU 4)= ÜÙ Ts (162 

ii i-1 

r(N AS N TA. 6 
Fig. 1-12. Partition LE ANS LL l'A a 6) 
de deux ensembles non 

disjoints N'étant qu'un cas particulier de la corres- 


pondance, l'application admet aussi bien 
les notions d'application inverse et de composée, notions qui 
ont été introduites à l'étude des correspondances. 


b) Applications définies sur un seul ensemble 


Un cas particulier très important de l'application a lieu quand 
les ensembles X et Y se confondent. L'application l': X — X repré- 
sente alors l'application de X dans lui-même et se définit par le 
couple 


(X, D), (1-64) 


où l' = X*. De pareilles applications sont étudiées en théorie des 
graphes; les éléments de cette théorie sont exposés au chapitre 2. 
Dans ce paragraphe, nous parlerons seulement de quelques opérations 
effectuées sur ces applications. 

Soient l'et À applications de l’ensemble X dans X. La composée 
de ces applications sera l'application l'A qui, en vertu de la règle 
énoncée au $ 1-4, se définit de la manière suivante: 


(A) z = F (Az). (1-65) 
Dans le cas particulier où A = F', on] obtient les applications 
2x = T ([xr); (1-66) 


ISz = FL (Lx), etc. (1-67) 
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Ainsi donc, dans le cas général pour touts>2ona 


V°z= (TT 1x). (1-68) 
Par définition spéciale, introduisons la relation 
Lx = x. (1-69) 


I1 devient possible d'étendre la relation (1-68) à des s négatifs. En 
effet, on a en vertu de (1-68) 


Fox=T(ltx)= TP ze x. (1-70) 
Cela signifie que l'-!x est une application inverse. Alors 
2x VA(T 1x), (1-74) 


et ainsi de suite. 


Exemple 1-18. Soit X l’ensemble des hommes. Pour tout homme zx € X, 
désignons par l'z l’ensemble de ses enfants. Alors l'?z sera l'ensemble des petits- 
enfants de x, l'îr l’ensemble de ses arrière-pctits-enfants, l-!z l’ensemble de 
ses parents, etc. 


T 


[x 
T°x 
Fig. 1-13. Arbre généalogique 


Représentant les hommes par des points ct tirant des flèches allant de z 
vers Jr, on obtient l'arbre généalogique, tel qu'on le voit, par exemple, à la 
figure 1-13. 

Exemple 1-19. Dans un jeu d'échecs, désignons par x une certaine position 
(c.-à-d. la disposition des pièces sur l’échiquier) qui peut avoir lieu au cours du 
jeu, et par X l’ensemble des positions possibles. Alors, pour tout x € X, on 
représentera par l'r l’ensemble des positions qui découlent de z après un coup 
fait en conformité avec les règles du jeu. Dans ce cas 

Fr = g si x est un mat ou un pat; 

T°z est l’ensemble des positions que l’on obtient de x en trois coups: 

T-1 x est l’ensemble des positions qui se ramènent à la position donnée 
en un seul coup. 


Pour les applications définies sur un seul ensemble, on emploie 
aussi d’autres appellations que l’on rencontrera par la suite. 

Par exemple, si les éléments x € X représentent les états d’un 
système dynamique, on peut considérer l'application Jr comme 
l’ensemble des états du système postérieurs à l’état donné. Il est 
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commode d'employer en cette occurrence le terme de transformation 
de l’état du système dynamique. Pour désigner certaines formes 
particulières d'applications définies sur un seul et même ensemble, 
on emploie aussi le terme de relation. 


c) Fonction, fonctionnelle, opérateur 


Considérons une application 
f:X—7Y. (1-72) 


Cette application reçoit le nom de fonction si elle est univoque, 
c.-à-d. si pour tout couple (x,, y,) E f et (22, y) € f l'égalité x, = x 
implique y, = y. | 

De la définition de l'application et des exemples qui viennent 
d’être étudiés, il est clair que les éléments des ensembles X et Y 
peuvent être les objets d’un caractère tout à fait arbitraire. Or, dans 
les problèmes de cybernétique, on attache un intérêt particulier aux 
applications qui sont univoques et dont l’ensemble de valeurs repré- 
sente l’ensemble des nombres réels À. L'application univoque f 


définie par (1-72) est appelée fonction à valeurs réelles si Y © R. 


Exemple 1-20. Supposons qu'on puisse aller de la ville donnée à une autre 
ville par train, par autocar ou par avion. Le prix du billet est respectivement de 
7, 9 et 12 roubles. Dans cet exemple, le prix du billet peut être considéré comme 
une fonction du moyen de transport. Pour ce faire, envisageons les ensembles 

X = {tr., car, av.}, Y = {7, 9, 12}. 


La fonction f:X — Ÿ obtenue dans les conditions de l'exemple donné 
peut être misc sous la forme de l’ensemble f = {{tr., 7), (car, 9), (av., 12) }. 


Dans chacun des couples (x, y) € f la valeur de y est dite fonction 
de z donné et s'écrit y — f (x). Cette écriture permet d'introduire 
la définition formelle suivante d’une fonction: 


f= (GG y EX X Yiy=ff(x)}. (1-73) 


De cette façon, le symbole f s'emploie pour définir une fonction 
et revêt deux significations: 

4) f est l’ensemble qui a pour éléments les couples (x, y) intéres- 
sés par la correspondance; 

2) f(x) désigne y E Y correspondant à x € X donné. 

La définition formelle de la fonction sous la forme de la relation 
(1-73) permet d'établir les procédés de définition de la fonction. 

4. L’énumération de tous les couples (x, y) faisant partie de 
l’ensemble f, comme dans l'exemple 1-20. Ce mode de définition de 
la fonction peut être utilisé lorsque X est un ensemble fini. Pour 
plus de clarté, on dispose les couples (x, y) sous la forme d’un tableau. 

2. Dans un grand nombre de cas, X et Ÿ sont des ensembles de 
nombres réels ou complexes; alors f (x) représente très souvent une 
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formule, c.-à-d. une expression réunissant quelques opérations 
mathématiques (addition, soustraction, division, prise de logarithme, 
etc.) qui doivent être effectuées sur z € X pour obtenir y. 

Exemple 1-21. Soient X=Y = R et f = {(x, y) E R°: y = r°}. Alors 


f(x) = 7°. 

Quelquefois, les différents sous-ensembles de l’ensemble X de la 
fonction s'expriment au moyen de formules différentes. Supposons 
que À,, ..., A, sont les sous-ensembles disjoints deux à deux 


de l'ensemble X. Soit f;(xz) (i—1,...,n) la formule 
définissant y pour z€ A:. 


Alors la fonction f(x) sera f(x) T 
définie par l’expression 

f(x) pour x Ai; ; , 
f(=X .........: —— 

fn (x) pour xE€ Au. a) b) 

(1-74) Fig. 1-14. Graphiques de fonctions 
Ainsi, la fonction y = f (x) — | x | peut être donnée sous la 

forme 


x pour z >0; 
y —= 
— zx pour x<(. 


3. Si X et Ÿ sont les ensembles des nombres réels, les éléments 
(x, y) E f peuvent être représentés par des points sur le plan}R®. La 
totalité de ces points formera le graphique de la fonction f (x). La 
figure 1-14,a donne le graphique de la fonction de l’exemple 1-21. 

Dans les problèmes de cybernétique, on a souvent affaire à des 
fonctions du temps. Ces fonctions définissent l'application d’un 
nombre fini ou infini de points d’un certain intervalle de temps 7 
sur l’ensemble des nombres réels X = À, ce qui s'écrit sous la forme 


f:T—+ X. (1-75) 


Désignant par { les éléments de l’ensemble T et par x ceux de 
l'ensemble X, on obtient la fonction x = f (t) qui définit la varia- 
tion de x avec le temps, comme il est montré, par exemple, sur la 
figure 1-14,b. Pour simplifier l’écriture, nous désignerons x en fonc- 
tion du temps simplement par x ((t). 

Si dans (1-72) X — U X V, on aboutit à une fonction de deux 
variables u et v désignée par f (u, v), où u E Uet v € V. La définition 
formelle de la fonction de deux variables réelles est : 


f= {(u, v, yEUX VX Y:y=f{(u, v)}. (1-76) 


On définit de la même façon les fonctions de trois variables et 
d'un nombre plus grand de variables. 
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Etant un cas particulier de la correspondance, la fonction vérifie 
les notions de fonction inverse et de composée de fonctions qui ont 
été établies pour la correspondance. Si f et g sont deux fonctions sur 
l'ensemble ÆR° et que 


Î:X—Y, g:Y —- 2, (1-77) 
les fonctions inverses seront : 
FA Y—X, gt:Z—7Y. (1-78) 
La composée des fonctions f et g 
fog:X—+2Z (1-79) 
pour tout x EZ définit z€Z qui s'écrit 
z2=(fog)x=g[f(x)]. (1-80) 


La fonctionnelle est une notion plus générale que la fonction. 
La fonctionnelle établit une dépendance entre un ensemble de nombres 
d’une part et un certain ensemble de fonctions d'autre part. En 
d’autres termes, la fonctionnelle définit la relation entre un nombre 
et une fonction. Pour donner un exemple de la fonctionnelle, citons 
une intégrale définie de la forme 


b 
T(D= | (dr. 


Nous voyons que la fonctionnelle J (f) est un nombre dépendant 
d’une fonction f (x), celle-ci étant choisie dans un ensemble donné 
de fonctions. 

L'opérateur est une notion encore plus générale. L'opérateur 
établit la correspondance entre deux ensembles de fonctions, de 
sorte qu’à chaque fonction d’un ensemble correspond une certaine 
fonction de l’autre. Désignant par p l'opérateur de dérivation, on 
écrit la relation entre la dérivée f’ (x) = df (x)/dx et la fonction 
f (x) sous la forme d’un opérateur 


f (@) = p [ (1. 


1-6. RELATIONS 


a) Propriétés des relations 


Comme on l’a déjà indiqué, le terme « relation » s'emploie pour 
designer certains types d'applications définies sur un seul et même 
ensemble. L'emploi de ce terme amène l'introduction d'une nata- 
tion spéciale. 
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Supposons que l’application (X, l) soit une relation. Considérons 
l'élément y € l'x. Le fait que l'élément y est lié par la relation F 
à l'élément x s’écrira 

yTz. (1-81) 


C'est ainsi que dans l'exemple 1-18 le symbole FT veut dire « être 
enfants de l'homme donné ». 

Nota. Utilisant pour une application définie sur un seul et même 
ensemble la relation (1-64). on se rend compte que la relation 
est un couple d’ensembles (X, l') dans lequel © = X*°. Puisque l’en- 
semble X*° a pour éléments les couples ordonnés, on peut dire que la 
relation est un ensemble de couples ordonnés. Chaque couple ne 
réunissant que deux éléments de l’ensemble X°, on dit quelquefois 
que la relation est binaire. 

Il est possible d'introduire une notion plus générale de relation 
en désignant sous ce terme un couple d’ensembles (X, F) où l = X”. 
L'ensemble X”" a pour élements des n-uplets ordonnés, ce qui permet 
de le nommer relation #-aire. En particulier, un ensemble de triplets 
ordonnés sera une relation {ernaire. Dans la suite, en disant « rela- 
tion », l’on sous-entendra de façon tacile une relation binaire. 

I] existe plusieurs catégories de relations en fonction de certaines 
propriétés que ces relations possèdent ou ne possèdent pas. 

On considère ci-dessous les six propriétés fondamentales des rela- 
tions en admettant que z, y et z sont des éléments quelconques d’un 
ensemble X. 

Réflexivité : xl'zx est vrai; antiréflexivité : xl'x est faux ; symétrie: 
2lTy — ylz; antisymétrie: zx2ly et ylxz —>x — y; asymétrie: si 
zT'y est vrai, yl'x est faux; transitivité: zly et ylz — zxlz. 

Considérons, sur la base de ces propriétés, quelques catégories 
importantes de relations. 


b) Relation d’équivalence 


Certains éléments d’un ensemble peuvent être considérés comme 
équivalents si, dans une considération donnée, il est possible de 
substituer à n'importe lequel de ces éléments un autre élément quel- 
conque. On dit alors que les éléments en question sont liés par la 
relation d'équivalence. 

Voici quelques exemples de relations d'équivalence: 

relation « faire partie d’une même année d’études (promotion) » 
définie sur l’ensemble des étudiants de la faculté; 

relation « avoir le même reste après division par 3» sur l’en- 
semble des entiers naturels: 

relation de parallélisme sur l’ensemble des droites du plan: 

relation de similitude sur l'ensemble des triangles, ctc. 

Pour donner une définition bien nette à la relation d'équivalence, 
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admettons que le terme de « relation d'équivalence » ne se justifie 
que si les trois conditions ci-dessous sont remplies: 

1) chaque élément est équivalent à lui-même; 

2) la proposition « deux éléments sont équivalents » reste vraie 
même si l’on ne précise pas lequel des éléments est le premier et 
lequel est le deuxième ; 

3) deux éléments équivalents à un troisième sont équivalents 
entre eux. 

Adoptons, pour désigner l’équivalence, le symbole =. La défini- 
tion générale de l’équivalence s'écrit alors, au moyen des trois con- 
ditions énumérées ci-dessus, sous la forme de trois expressions: 

1) z= zx (réflexivité); 

2)xz=y—y—=zx (symétrie); 

3) z= yet y=2:—1—= 7 (transitivité). 

Ainsi donc, pour que la relation [soit une relation d'équivalence, 
il faut qu’elle soit réflexive, symétrique et transitive. 

La relation d'équivalence se trouve intimement liée à la partition 
d’un ensemble ($ 1-2). Soit X l’ensemble sur lequel est définie une 
relation d'équivalence. Par exemple, X est l’ensemble des étudiants 
de la promotion, tandis que la relation d'équivalence s'exprime par 
la relation « être membres d’un même groupe d’études ». Le sous- 
ensemble des éléments équivalents à un certain élément x € X 
sera dit classe d'équivalence. De cette façon, le groupe d’études dans 
lequel fait ses études l'étudiant [vanov sera la classe d'équivalence 
équivalente à l'étudiant [vanov. 

Soit J un ensemble d'indices. Désignons par {4; = X:j€J} 
l’ensemble des classes d'équivalence pour l’ensemble X. Il est évident 
que tous les éléments d’une classe d'équivalence sont équivalents 
entre eux (en vertu de la propriété de transitivité) et un élément 
quelconque x € X ne peut se trouver que dans une classe et une seule. 
Or, X représente alors la réunion des ensembles disjoints À, de sorte 
que le système complet des classes {4,; = X : j € J} est une partition 
de X. Ainsi donc, à chaque relation d'équivalence sur l’ensemble X 
correspond une certaine partition de X en classes À,;. 

On dit que la relation d'équivalence sur ZX et la partition de X 
en classes sont conjuguées lorsque, pour tout x et y sur X, la relation 
z = y se vérifie si et seulement si x et y appartiennent à une seule 
et, même classe À; de cette partition. Comparant les exemples 
du paragraphe donné à ceux du paragraphe 1-2, on arrive à se faire 
une idée plus nette de la liaison existant entre la relation d’'équiva- 
lence et la partition d’un ensemble. 

En qualité de symbole général de la relation d'équivalence, on 


emploie le symbole = (quelquefois —). Par contre, pour désigner 
des relations particulières d'équivalence, on fait usage d'autres 
symboles, notamment: — pour désigner une égalité, || pour un paral- 


lélisme, = pour une équivalence logique. 
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c) Relation d'ordre 


On a très souvent affaire aux relations qui définissent l’ordre suc- 
cessif des éléments d’un ensemble. C’est ainsi que nous distinguons 
les notions « avant » et « après » quand les éléments de l’ensemble 
sont les états d’un système dynamique, et les notions « plus grand 
que » (symbole >) et «plus petit que» (symbole <<) quand ces 
éléments sont des nombres. Les notions d'ensemble et de sous-ensem- 
ble se distinguent à l’aide des symboles = ou. 

Dans tous ces cas il est possible de disposer les éléments de l’en- 
semble X ou des groupes d'éléments dans un ordre déterminé, ou, 
en d’autres mots, d'introduire une relation d’ordre dans l'ensem- 
ble X. 

On distingue la relation d'ordre (ou d'ordre partiel) désignée par le 
symbole < (cas particuliers <, = ) et la relation de bon ordre (ou 
d'ordre stricte) désignée par le symbole << (cas particuliers <,€, —). 
Définissons ces relations en énumérant les propriétés qu’elles doivent 
posséder. 

On parle d'une relation d'ordre partiel si elle possède les trois 
propriétés suivantes: 

zx zx est vrai (réflexivité); 

z<yetyLxz—x = y (antisymétrie); 

z<Ly et yLz—+zLZ (transitivité). 

On parle d'une relation de bon ordre si elle possède les trois pro- 
priétes suivantes: 

x << x est faux (antiréflexivité); 

z<y et y Lx s'excluent (asymétrie); 

z<yety<z—>x<z (transitivité). 

On dit que l’ensemble X est ordonné si deux éléments quelcon- 
ques x et y de cet ensemble sont comparables, c.-à-d. si l’on a 


T<LY OUT =YOU Y<L LT. 


d) Relation de dominance 


Dans les cas où X désigne un ensemble d'hommes ou de groupes 
d'hommes, on rencontre quelquefois une relation dite de dominance. 
On dit que x domine y et l’on écrit x S y si x s'avère supérieur à y 
sous un rapport quelconque. Par exemple, x peut être le sportif ou 
l’équipe sportive qui a gagné le match au sportif ou à l'équipe spor- 
tive y, ou bien une personne qui a de l’autorité auprès de la person- 
ne y, ou encore une propriété que nous préférons à la propriete y. 

Nous dirons que les éléments de X sont liés par la relation de 
dominance si ces éléments possèdent les deux propriétés suivantes: 

1) aucun individu ne peut se dominer soi-même, c.-à-d. que 
zŸS x est faux (antiréflexivité); 
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2) dans chaque couple d'individus un individu domine absolu- 
ment l’autre, c.-à-d. que zx ÿ y et y à x s’excluentréciproquement 
(asymétrie). 

Lorsqu'il s’agit de la relation de dominance, la propriété de 
transitivité n'intervient pas. En effet, si l’équipe x a gagné le match 
à l’équipe y et cette équipe y a gagné le match à l’équipe z, cela ne 
veut point dire que l’équipe x gagnera à coup sûr dans le match avec 
l'équipe z. 
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a) Groupes, anneaux, corps 


Avec l’évolution des mathématiques, les opérations algébriques 
(addition, multiplication, division) applicables initialement aux 
nombres rationnels furent étendues à toute une série d’autres objets: 
nombres complexes, vecteurs, matrices, etc. Les règles d'exécution 
de ces opérations varient selon l’objet. Toutefois ces opérations 
possèdent des propriétes communes dont la connaissance permet 
d’établir s’il est possible d’effectuer l'opération donnée sur une classe 
concrète d'objets. L'établissement de ces propriétés permet de 
dégager les notions d'opération algébrique, groupe, anneau, corps. 

Soit X un ensemble quelconque. Faisant correspondre à tout 
couple ordonné (a, b) € X°, de façon univoque, un certain élément c 
appartenant au même ensemble X, on dit qu’une opération algébrique 
est définie sur X. L'opération ainsi définie s'appelle multiplication 
ou addition et s'écrit 


c— ab ou c—a + b. (1-82) 
On dit que l'opération algébrique est associative si pour tout 
a, b,cECEX on a 
(ab)c — a (bc) ou (a+ b)+c—a+(b + oc). 
L'ensemble X avec une opération associative définie sur cet 
ensemble (désignée en attendant sous le terme de multiplication) 
s'appelle demi-groupe. Un demi-groupe est dit groupe si: 
1) il existe dans X un élément e tel que, pour tout a€ X, 
ae —œ ea — 4; (1-83) 
2) il existe pour tout a € X un élément a”! tel que 
aa =a la=e. (1-84) 


L'élément e porte le nom d'unité du groupe; l'élément a”! est 
l'inverse de a. Si l’opération définie sur le groupe est l'addition, on 
dit que e est le zéro du groupe (symbole 0) et l'élément a”! l'opposé 
à a (symbole —a). Les éléments 0 et —a vérifient les relations 


a+0—0+a--a,at+(—a) = 0. (1-85) 
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Si À est un ensemble fini, le groupe s'appelle fini. Voici quel- 
ques exemples de groupes: 

ensemble d’entiers vis-à-vis de l'opération d’addition; 

ensemble de nombres pairs vis-à-vis de l’opération d'addition; 

ensemble des nombres rationnels non nuls vis-à-vis de l'opéra- 
tion de multiplication; 

ensemble des vecteurs du plan vis-à-vis de l'opération d’addi- 
tion des vecteurs. 

Cependant, les nombres entiers ne constituent pas de groupe 
vis-à-vis de l'opération de multiplication, car un nombre entier 
qui diffère de +1 n’a pas d’inverse entier. Pour donner un exemple 
de groupe fini, citons l’ensemble {1, —1, i, —i} dans lequel i — 
= V —1 vis-à-vis de l'opération de multiplication. 

Supposons que deux opérations algébriques, l'addition et la 
multiplication, soient définies simultanément sur un ensemble X. 
Supposons en outre que l'opération d'addition soit commutative 
(a + b — b + a) et que l'opération de multiplication soit liée à 
celle d’addition par des lois distributives 


a(b+c)—ab+ac et (b+c) a = ba+ca. (1-86) 


On dit alors que l’ensemble en question est un anneau. Un anneau 
peut ne pas avoir d'unité ni d'éléments inverses. Si l’anneau possède 
bien une unité, c’est un anneau unitaire. Parmi les anneaux, on 
compte les ensembles des nombres entiers, des nombres rationnels, 
des nombres réels, des nombres complexes vis-à-vis des opérations 
classiques d’addition et de multiplication. 

Un anneau dans lequel pour tout a 0 et pour tout b il y a exac- 
tement un élément x tel que ax — b s'appelle corps. L'élément x 
s'appelle quotient de b par a et se désigne par x = b/a. Pour donner 
des exemples de corps, citons l'anneau des nombres rationnels, 
l'anneau des nombres réels, l’anneau des nombres complexes. 


b) Isomorphisme. Homomorphisme. Modèles 


Dans les études scientifiques et pratiques, un rôle remarquable 
revient à la simulation des systèmes et situations réels. On entend 
sous ce terme l'établissement d’une relation d'équivalence entre 
deux systèmes, dont chacun peut être ou bien une réalité objective, 
ou bien une abstraction. S'il s'avère que le premier système se 
prête mieux à l’étude que le deuxième, on se fait une idée des pro- 
priétés du deuxième en observant le comportement du premier. Dans 
ce cas le système choisi pour l’étude porte le nom de modèle. 

Un modèle est dit isomorphe (de même forme) si le système réel 
et le modèle coïncident d’une manière très complète, élément par 
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élément. C’est le cas d’un négatif photographique et de l'épreuve 
tirée de ce négatif, d’un dessin et de la pièce exécutée d'après ce 
dessin, des processus quelconques se produisant dans un système 
réel et de la solution de l'équation décrivant le comportement du 
système. 

Or, les modèles isomorphes s'avèrent très souvent excessivement 
compliqués et peu commodes pour l'utilisation pratique. Il y a 
plus d'intérêt à créer des modèles permettant de définir uniquement 
les aspects essentiels du comportement des systèmes réels, sans en- 
trer inutilement dans le détail. C’est le cas, par exemple, d’une 
carte géographique vis-à-vis du terrain qu’elle représente. 

Les modèles dont les différents éléments ne correspondent qu'à 
des parties plus ou moins grosses du système réel, sans qu'il y ait 
correspondance parfaite élément par élément entre modèle et système, 
sont dits modèles homomorphes. 

L’isomorphisme et l’homomorphisme sont susceptibles d’une 
définition mathématique rigoureuse aux termes de la théorie des 
groupes. 

Soient X et Ÿ des groupes. Lorsque les éléments de ces groupes 
sont liés par une correspondance biunivoque telle que, pour n’im- 
porte quels éléments a, bE X et les éléments a’, b’EY qui leur 
correspondent, à l'élément c — ab correspondra l'élément c’ égal 
à a’b’, on dira que les groupes sont isomorphes. 

Les groupes isomorphes ne peuvent différer que par la nature de 
leurs éléments et peut-être par le genre des opérations définies sur 
le groupe; cependant toutes les propriétés des groupes isomorphes 
entre eux, qui résultent des propriétés des opérations définies sur 
ces groupes et qui ne dépendent pas de la nature des éléments du 
groupe, sont communes. 

Dans les groupes homomorphes, la correspondance entre les grou- 
pes est unilatérale. On dit que l’application du groupe X dans le 
groupe Ÿ est hkomomorphe si à chaque élément de X correspond de 
façon univoque un élément déterminé de Y, de sorte que si aux 
éléments a, b € X correspondent les éléments a’, b"E Y, à l'élé- 
ment ab = c corresponde l'élément c’ = a’b’. Dans le cas général, 
étant donné un homomorphisme de la forme X —Y, il est possible 
que différents éléments du groupe X passent à l'élément donné du 
groupe Ÿ ; il est tout aussi possible qu'aucun élément n'y passe. 


PROBLÈMES AU CHAPITRE PREMIER 


1-1. Quel est l’ensemble Y X X de l'exemple 1-1? 
4-2. Désigner par hachure l'ensemble Y X X de l’exemple 1-3. 
1-3. Soient R l’ensemble des nombres réels et 


X={zCR:0<z<1} Y={yER:0<uy<21. 
Quels sont les ensembles X U Y, X NF, XNXY? 
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1-4. Tracer les figures représentatives des ensembles À = {(z, y) € R?: r?+ 
+ y Li}et B = {(2, y) € R°:rt + (y — 1} KL 1}. 

Par quelles figures sont représentés les ensembles A4 UB,A/fNB,R°\X 4? 

1-5. Utilisant (1-34), démontrer les identités XfNg = g; XUg — 
= X; INX=X; IUX = I. 

1-6. Représenter sur le plan réel R° = R X R les ensembles X X Y et 
Y X X du problème 1-3. 

ri Représenter géométriquement les ensembles À X R et RX À, où 
A = |2, 3]. 

1-8. Etant donné l’ensemble M = {(x, y) € R°:(z—2)° + y? = 1}, cher- 
cher pr, M et pra M. 

1-9. Soient 1 — {z,, z2, z3} l’ensemble universel, et X = {x,, r.}, Ÿ — 
= (ze, Za}, Z = {(x.} ses sous-ensembles. Définir par énumération les ensembles 
suivants: 


XXX;, ZxXZ; XXY;, YXX;, XXYMNYXX; XXYUY XX. 


1-10. Soient X, Y, Z les sous-ensembles de l’ensemble R? égaux à X — 
= {(z, y):z > 0); Y = {(z, y):y > 0}; Z = {(x, y):x + y > 1}. Donner la 
représentation géométrique des ensembles 


X:Y:Z: XUY: XUY : XNY : XNY : XNZ:; XNZ: 
xnYnz; xnynz. 


1-11. Quel est l’ensemble X X Y si X et Y sont les sous-ensembles de l’en- 
semble R? égaux à X = {(x, y):27 + y = 1}; Y = {(z, y):r — y = 0}? 

1-12. Ecrire pour l'exemple 1-13 toutes les seize correspondances. Définir 
pour chacune d'entre elles pro et pr.0. 

1-13. Trouver pour la fonction f de l’exemple 1-21 la fonction inverse f-1. 

1-14. Soient f et g les fonctions sur un ensemble R° telles que f — 
= {(z,y):y:r} et g = {(y, z):z = sin y}. Trouver la composée de ces fonctions 
fO&g. 


CHAPITRE 2 


ÉLÉMENTS DE LA THÉORIE DES GRAPHES 


2-1. DÉFINITIONS PRINCIPALES DE LA THÉORIE DES GRAPHES 


a) Définition d’un graphe 
en termes de la théorie des ensembles 


La meilleure façon de se faire une idée de ce qu'est un graphe 
consiste à imaginer un ensemble de points d’un plan X, appelés 
sommets, et un ensemble de tronçons orientés U reliant tous les som- 
mets ou certains d’entre eux et appelés arcs [12 à 14]. Du point de 
vue mathématique, un graphe G est 
un couple d’ensembles X et U: 


G=(X, U). (2-1) 


On voit à la figure 2-1 un graphe 
dont les sommets sont les points 
a, b,c,d,e, g,h, et les arcs, les 
EN (a, a), (c, D d), (a, c), 

. . , d, d), (c, e), (e, d), (g, h). Voici 

Fig. 2-1. Vue générale d'un graphe quelques exemples de graphes: re- 

lations de paternité et de maternité 

dans un ensemble des hommes (voir fig. 1-13), carte routière, schéma 

des connexions d'appareils électriques, relations de supériorité de 

certains participants d’un tournoi par rapport aux autres, et ainsi 
de suite. 

Il est quelquefois plus commode de donner au graphe une autre 
définition. On peut admettre que l’ensemble des arcs dirigés U reliant 
les éléments d’un ensemble X est l’application de ce dernier ensem- 
ble dans lui-même. On considère donc que le graphe est défini si l’on 
connaît l’ensemble de ses sommets X et le mode d'application T 
de l’ensemble X dans À. Ainsi donc, un graphe G est un couple (X, 
J') réunissant un ensemble X et une application l définie sur cet 
ensemble : 


G= (X, F). (2-2) 
Par exemple, pour le graphe représenté sur la figure 2-1 l’appli- 
cation [' trouve la définition suivante: 
Fa=a; Fb=@; lc={b,d,e}; ld={d, c}; Te=d; 
Tg=h; Fh=@. 


On se rend compte sans peine que cette définition du graphe 
coïncide entièrement avec celle d'une relation sur un ensemble. 
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Il y a parfois intérêt à représenter les graphes sous la forme de 
matrices, en particulier des matrices associées à un graphe et des 
matrices d'incidence. Donnons d’abord deux définitions. 

Deux sommets x et y sont adjacents s'ils sont distincts et s’il 
existe un arc allant de x à y. 

Un arc u prenant naissance ou se terminant en zx est dit incident 
au sommet Z. 

Désignons par z,, ..., x, les sommets d'un graphe, et par 
Uj, - + + Um Ses arcs. Introduisons les nombres: 


4 s’il existe un arc reliant les sommets à et j; 
Ti = . 
ij 0 si cet arc est absent. 


Une matrice carrée R = ||r;; || d'ordre r X n porte le nom de 
matrice associée à un graphe. 
Introduisons ensuite les nombres 


+ 1 si u; est incident à zx; vers l'extérieur ; 
Siÿÿ = À —1 si u; est incident à x; vers l'intérieur ; 
0 si u, n’est pas incident à x;. 
j 


Une matrice S — || s;, || d'ordre nr X m est dite matrice d'in- 
cidence pour les arcs du graphe. 

Les matrices d'incidence telles qu’on vient de les définir ne sont 
applicables qu’à des graphes sans boucles. Si le graphe comporte des 
boucles, il convient de partager la matrice en deux demi-matrices, 
positive et négative. 

Introduisons quelques notions et définitions utiles pour la descrip- 
tion de certaines catégories de graphes. 

Le sous-graphe G, d’un graphe G — (X, F) est un graphe qui 
n’englobe que la partie des sommets du graphe G formant l’ensemble 
A avec les arcs réunissant ces sommets: c’est le cas du domaine 
délimité par la courbe en trait pointillé à la figure 2-1. La définition 
mathématique du sous-graphe G, est 


Ga = (4, Th), (2-3) 
ASZX, Taz=(Tr)fN A. (2-4) 
Un graphe partiel GA par rapport à un graphe G = (X, [) est 


un graphe ne contenant qu'une partie des arcs du graphe G, c.-à-d. 
défini par la condition 


où 


Ga — (X, A), (2-5) 


+ 


ou 
Ar TZ. (2-6) 


A la figure 2-1 le graphe formé par les arcs tracés en trait gras 
est un graphe partiel. 
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Exemple 2-1. Soit G == (X, l) la carte routière de l'Union Soviétique. Alors 
la carte routière de la région de Tambov est un sous-graphe, ct la carte roütière 
sommaire de l’Union Soviétique ne montrant que les artères principales est un 
graphe partiel. 


Deux autres notions importantes sont celles du chemin et du 
circuit. On a défini un arc comme un tronçon dirigé reliant deux 
sommets. L’arc reliant les sommets a et b et dirigé de a vers b se note 
u — (a, b). 

Le chemin dans un graphe G est une succession d’arcsu = (u,, .. 

-., Ur) où l’origine de l’un est l'extrémité du précédent. Le 
chemin u qui passe par les sommets successifs a, b, . .., m est 
désigné paru = (a, b, ..., m). La longueur du chemin up = (u, ... 

., Un) est la quantité L (1) = À égale au nombre d'arcs formant 
le chemin u. Un chemin peut être fini ou infini. Pour le chemin 
infini on a ['(u) = oo. Un chemin n'empruntant jamais deux fois 
le même arc est dit simple. Un chemin ne passant jamais deux fois 
par le même sommet est dit élémentaire. 

Le circuit est un chemin fini u = (x, ..., z;,) dont le sommet 
initial z, se confond avec le sommet terminal z,. Le circuit est dit 
élémentaire s’il a tous ses sommets distincts (à l'exception de l’origine 
et de l'extrémité qui coïncident). Un circuit de longueur unité formé 
par un arc de la forme (a, a) est appelé boucle. On voit sur la figure 
2-1 un chemin (e, d, c, b), un circuit (c, e, d, c) et une boucle (4, d). 

Il y a des cas où, considérant un graphe, on fait abstraction de 
l'orientation de ses arcs. On dit alors qu'il s’agit d’un graphe non 
orienté. Pour un graphe non orienté, les notions d'arc, de chemin et 
de circuit cedent la place à celles d’arête, de chaîne et de cycle. 
L’arête est un tronçon reliant deux sommets. Le graphe de la figu- 
re 2-1 possède huit arcs mais sept arêtes. La chaîne est une succession 
d’arêtes. Le cycle est une chaîne finie qui a l’origine et l'extrémité 
en un même point. 

À la notion de graphe non orienté est liée une propriété fort 
importante de connectivité du graphe. Un graphe est connexe si 
deux quelconques de ses sommets sont unis par une même chaîne. 
Un graphe non connexe G peut être partagé en sous-graphes G; de 
telle façon que tous les sommets dans chaque sous-graphe soient 
connexes mais que les sommets des différents sous-graphes ne le 
soient pas. De tels sous-graphes G; portent le nom de composantes 
connexes du graphe G. 

Pour trouver si un graphe orienté est connexe ou non, il y a 
lieu de faire abstraction de l'orientation des arcs. Le graphe repré- 
senté sur la figure 2-1 n’est pas connexe. Or, son sous-graphe com- 
prenant les sommets b, c, d, e est connexe. On dit parfois d’un graphe 
orienté qu’il est fortement connexe: on entend par là que, pour n’im- 
porte quels deux sommets x et y (rx Æ y) il v a un chemin allant de 
TZ à y. 
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Un cas particulier fort important d’un graphe non orienté est 
l’arbre. On entend par arbre un graphe non orienté fini connexe 
sans cycles; quelques exemples d'arbres sont représentés à la figu- 
re 2-2. 

Etant donné un ensemble de sommets a, b, c, ..., l'arbre se 
construit de la façon suivante. Choisissons un sommet a en qualité 
de point de départ : ce sera la racine de l'arbre. A partir de ce sommet, 


Fig. 2-2. Exemples d’arbres 


traçons des arêtes jusqu'aux sommets les plus proches b, c, d, ..., 
et à partir de ceux-ci, jusqu'aux sommets voisins e, f, g, hk, ..., 
et ainsi de suite. Ainsi donc, un arbre se construit en ajoutant succes- 
sivement des arêtes dans ses sommets. Ceci permet d’établir un rap- 
port entre le nombre de sommets et celui d’arêtes d’un arbre. 

L'arbre le plus élémentaire se compose de deux sommets liés 
entre eux par une arête. Chaque fois que nous y ajoutons une arête, 
nous ajoutons par là même encore un sommet qui se trouve au point 
terminal de cette arête. Donc, un arbre à #7 sommets possède nr — 1 
arêtes. 


b) Relation d’ordre 
et relation d'équivalence sur un graphe 


Nous venons de voir que le graphe permet de donner une repré- 
sentation géométrique commode des relations sur un ensemble. Aussl 
la théorie des graphes et la théorie des relations sur un ensemble se 
complètent-elles mutuellement. 

Nous admettrons qu’un graphe G = (X, l) est muni d’une rela- 
tion d'ordre si ses deux sommets quelconques zx et y, tels que zx y, 
peuvent être liés par un chemin allant de x à y. On dira alors que 
le sommet x précède le sommet y, ou que le sommet y suit le som- 
met x. 

Montrons que cette définition tient compte de toutes les proprié- 
tés de la relation d'ordre sur un graphe. 

Réflexivité. La condition 


x zrest vrai (2-7) 
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veut dire que le sommet est équivalent à lui-même, soit r = x. 
D'autre part, il n’est pas moins légitime de considérer cette condi- 
tion comme celle d'existence d’un chemin allant de x à x, c.-à-d. de la 
boucle au sommet zx (fig. 2-3,a). 

Transitivité. La condition 


TÉY YLIH7I<Z (2-8) 


signifie que l’on rencontre successivement les sommets x, y, z en 
parcourant un seul et même chemin (fig. 2-3,b). 


Q < 
a) 


ê) 


Fig. 2-3. Illustration des propriétés de la relation d'ordre 


Antisymétrie. Montrons que la condition 
TÉY, YLTrI=Y (2-9) 


est vraie. On voit du premier membre de cette expression qui) 
existe le chemin de x à y et aussi le chemin de y à x. Or, cela équivaut 
à dire que le graphe comprend un circuit passant par les sommets zx 
et y (fig. 2-3,c). 

Il ressort du second membre de (2-9) que les sommets situés sur un 
même circuit sont équivalents. Assimilons cette conclusion à une 
définition de l’équivalence sur un graphe et montrons que cette 
définition tient compte de toutes les trois conditions de la relation 
d'équivalence. La condition de réflexivité x = zx et celle de symé- 
trie z= y —+y= zx sont évidentes et découlent de la définition 
de l’équivalence donnée ci-dessus. La condition de transitivité 
Z=Y, yY=2—>1=7Zz est aussi évidente, car elle suppose qu'un 
graphe muni d'un circuit de sommets zx et y et d’un circuit de som- 
mets y et z comporte sürement un circuit de sommets x et 3 (voir 
fig. 2-3,c). 

De cette façon, la relation d'ordre et la relation d'équivalence 
définissent conjointement un certain graphe. 

Un graphe peut aussi être muni d’une relation de bon ordre. 
Dans ce cas, pour tout couple de sommets x et y vérifiant la condi- 
tion z << y, il existe un chemin de x à y. De même que dans le cas 
précédent, la condition de transitivité x y, y<<2—zx1<2 veut 
dire que x, y et z sont les sommets successifs d’un seul et même che- 
min. La condition d'antiréflexivité (x < x est faux) demunit le 
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graphe de boucles, et la condition d'asymétrie (x << y, y < x s'ex- 
cluant réciproquement) le démunit de circuits. 

On voit donc que la relation de bon ordre définit un graphe sans 
circuits. 


c) Caractéristiques des graphes 


La résolution de nombreux problèmes techniques par les métho- 
des de la théorie des graphes se ramène à définir telles ou telles 
caractéristiques des graphes. Bien que le présent ouvrage ne puisse 
englober les applications techniques de la théorie des graphes, la 
connaissance des principales caractéristiques des graphes peut 
s'avérer d’une grande utilité lors de l'étude des matières les plus 
diverses. 

Nombre cyclomatique. Soit G un graphe non orienté ayant r som- 
mets, m arêtes et r composantes connexes. Le nombre cyclomatique 
de ce graphe G est le nombre 


v(G=m—n<+r. 

Ce nombre a la signification physique remarquable: il est égal 
au plus grand nombre de cycles indépendants que le graphe puisse 
avoir. Lors du calcul des réseaux électriques, on se sert du nombre 
cyclomatique pour déterminer le nombre de circuits indépendants. 

Nombre chromatique. Soit p un entier naturel. On dit d'un graphe 
G qu'il est p-chromatique s'il est possible de peindre ses sommets en 
p couleurs différentes de telle façon qu'aucun de ses sommets ne soit 
de la même couleur qu'un sommet adjacent. Le plus petit nombre 
p pour lequel le graphe est p-chromatique est appelé nombre chroma- 
tique du graphe et est noté y (G). 

Si y (G) = 2, le graphe est dit bichromatique. Pour qu'un graphe 
soit bichromatique, il faut et il suffit qu'il soit exempt de cycles de 
longueur impaire. 

Le nombre chromatique joue un rôle très important lorsqu'il 
s'agit d'utiliser de façon optimale les cellules de la mémoire en 
établissant le programme. Il est à noter cependant que sa détermina- 
tion, sauf s’il s’agit d’un graphe bichromatique, est difficile et exige 
assez souvent la mise en œuvre d’une machine à calculer électronique. 

Ensemble stable intérieurement. Un ensemble S & X sur un 
graphe G = (X, l') est dit stable intérieurement s’il n'y a pas dans 
S deux sommets adjacents, c.-à-d. si, pour tout z € S,ona zx NN S — 


Un ensemble stable intérieurement contenant le plus grand nom- 
bre d'éléments porte le nom du plus grand ensemble stable intérieure- 
ment, et le nombre d'éléments de cet ensemble s'appelle nombre de 
stabilité interne du graphe G. Le plus grand ensemble stable inté- 
rieurement joue un rôle important dans la théorie des communica- 
tions. 
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Ensemble stable extérieurement. Un ensemble TE X sur un graphe 
G = (X, [} est dit stable extérieurement si n’importe quel sommet 
extérieur à 7 est relié par des arcs à des sommets de 7’, c.-à-d. si 
pour tout zéTonalrfNT#x@. 

Un ensemble stable extérieurement contenant le plus petit 
nombre d'éléments porte le nom du plus petit ensemble stable 
extérieurement, et le nombre d’éléments de cet ensemble s'appelle 
nombre de stabilité externe du graphe G. 
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a) Position du problème 


Dans des applications pratiques, on attache une importance 
considérable à la recherche du plus court chemin entre deux sommets 
d’un graphe non orienté connexe. C’est à un problème de ce genre 
qu’on peut ramener de nombreux cas où il s’agit de fixer l'itinéraire 
optimal (du point de vue de la distance, du temps, du coût) sur la 
carte de routes donnée, de choisir le procédé le plus économique pour 
faire passer un système dynamique d'un état à un autre, etc. Les 
mathématiques fournissent nombre de méthodes convenant à ces 
problèmes. Or, ce sont encore les méthodes relevant de la théorie 
des graphes qui s'avèrent bien souvent les moins encombrantes. 

Dans sa forme générale, le problème du plus court chemin sur 
un graphe s’énonce comme suit. Soit un graphe non orienté G — (X, U). 
Chaque arête de ce graphe se caractérise par un nombre L (u) > 0 
dit longueur de l’arête. Suivant le cas, le nombre / (u) peut se 
présenter comme la distance entre les sommets réunis par l’arête u, 
comme la durée ou le prix du voyage le long de cette arèête, etc. 
Toute chaîne u aura alors pour longueur 


L(p)= À L(u). (2-10) 
ueH 

Il s'agit de chercher, pour deux sommets arbitraires a et b du 
graphe G, un chemin u,4, tel que salongueur totale soit aussi 

petite que possible. 
Avant d'aborder la méthode générale de résolution de ce pro- 
blème, arrétons-nous sur la règle donnant solution du problème par- 
ticulier dans lequel la longueur de chaque arête est égale à l'unité. 


b) Recherche du plus court chemin 
dans un graphe à arêtes de longueur unité 


On rencontre parfois des graphes dont les arêtes ont la même 
longueur prise pour l'unité. Les sommets d’un tel graphe repré- 
sentent généralement les états d’un certain système dans lequel 
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tous les passages effectués en un seul pas sont, d’un certain point 
de vue, équivalents. Nous proposons au lecteur un problème qui 
se ramène au cas d’un graphe à arêtes de longueur unité. Ce problème 
illustre les modes de construction des graphes pour differents cas 
concrets. 


Exemple 2-2. Problème de la tour de Hanoï. Dans une plaque sont plantées 
trois fiches. Sur la première fiche sont enfilées m rondelles dont le diamètre dé- 
croît de bas en haut. On demande de transférer les rondelles une à une à la troisiè- 
me fiche en les disposant finalement dans l’ordre initial, de façon qu'à aucun 


21 


S- 


ô) C) 


Fig. 2-4. Graphes des transferts dans le problème de la tour de Hanoï 


moment et sur aucune fiche une rondelle de diamètre plus grand ne se trouve 
superposée à une rondelle de diamètre plus petit ; la deuxième fiche sert de fiche 
intermédiaire. Une condition supplémentaire peut être imposée : la solution doit 
être obtenue avec le minimum de pas. 

Affectons les rondelles de numéros dans l'ordre de décroissance de diamètre: 
m,m—1,...,1. Désignons par X, Y et Z les ensembles des rondelles sc trou- 
vant à un pas quelconque respectivement sur la première, sur la deuxième 
et sur la troisième fiche. Ceci posé, il suffit de préciser les ensembles X et Z, 
l'ensemble Ÿ étant complémentaire de X et Z dans l’ensemble de toutes les 
rondelles. Chacun des ensembles X ou Z peut être représenté par l’une des com- 
binaisons suivantes de rondelles : 0, 1, 2, 21, 3, 31, 32, 321, 4, 41, 42, 421, 43, 
431, 432, 4321, ... On peut représenter ces combinaisons sous la forme de 
points sur les axes des X et Z, ainsi qu'il est montré sur la figure 2-4, de sorte 
que toute disposition des rondelles soit représentée par un certain point sur le 
plan (X, Z). Reliant ces points par des lignes qui montrent les transferts de 
rondelles possibles à chaque pas, on se trouve en présence d’un graphe non orien- 
té permettant de trouver un chemin (et aussi le plus court chemin) de passage 
du point initial du graphe à son point terminal. 

On peut construire le graphe en passant de m rondelles à m + 1 rondelles. 
Pour m = 1 les états possibles seront représentés par un ensemble {(1,0), (0,0), 
(0,11) auquel correspond le graphe de la figure 2-4,a; on y distingue le passage 
le plus court de l'état initial (1,0) à l’état final (0,1). 
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Pour obtenir la règle générale, admettons que l’on a déjà construit le graphe 

pour le cas de m rondelles ; appelons-le m-graphe. Il est facile de voir qu'un tel 

phe a la forme d'un triangle (fig. 2-5,a), sans qu'on connaisse toutefois, 

a cette étape, ses liaisons internes. Que devient ce graphe si l’on prend m + 1 
rondelles ? 

Remarquons que la rondelle numéro m + 1 ne peut occuper, à toutes les 
fiches, que la position la plus basse. Les autres m rondelles peuvent se déplacer 
de manière arbitraire suivant le m-graphe, sans que la rondelle numéro m + 1 
soit dérangée. Par conséquent, le graphe pour le cas de m “+ 1 rondelles 


_O-0---—-2 
TN 
# 
s 


M... 1 me+lmeil Mm+l,...lxX 


b) 
Fig. 2-5. Passage du m-graphe au (m + 1)-graphe 


(fig. 2-5.b) se compose de trois m-graphes désignés par les chiffres cerclés 1, 2 
et 3 indiquant le numéro de la fiche sur laquelle est enfilée la rondelle numéro 
m + 1. Il reste de savoir quels sont les passages d'un m-graphe à l’autre qui 
correspondent au transfert de la rondelle numéro m + 1. 

La rondelle numéro m + 1 ne peut être placée que sur une fiche libre; or, 
ce n’est possible que lorsque toutes les m rondelles de diamètre inférieur se trou- 
vent réunies sur l’une des fiches. On voit sur la figure 2-5,b les transferts pos- 
sibles de la rondelle numéro m + 1 désignés par les chiffres 7. 2 et 3 qui indi- 
quent le numéro de la fiche sur laquelle sont enfilées les m rondelles plus petites. 

Le diagramme de la figure 2-5,b fournit le principe général de passage 
du m-graphe au (m + 1)-graphe. A la figure 2-4,b et +, sont résumés les gra- 
phes des transferts pour deux ct trois rondelles. 


Passons au problème de recherche dans le graphe du chemin le 
plus court entre le sommet initial et le sommet terminal. Les graphes 
examinés ci-dessus étant relativement simples, il serait facile de 
trouver le chemin le plus court par recensement des chemins possi- 
bles. Or, pour des graphes complexes, il importe de trouver une mé- 
thode générale. 
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La règle générale de recherche du chemin le plus court dans un 
graphe consiste en ce qu’on attribue à chaque sommet zx; un indice- 
À: égal à la longueur du plus court chemin allant du sommet donné 
jusqu’au sommet terminal. Dans le cas où le graphe a toutes ses. 
arêtes de longueur unité, les sommets sont marqués dans l'ordre- 
suivant : 

1) on attribue l’indice O0 au sommet terminal x,; 

2) tous les sommets liés par une arête au sommet terminal sont 
munis d'indice 1; 

3) à tous les sommets non encorel marqués reliés par une arête- 
à un sommet d'indice À: on attribue l'indice À; + 1. Ce processus 
a lieu jusqu’à ce que le sommet initial soit marqué. À ce moment. 
l'indice du sommet initial sera égal à la longueur du plus court. 
chemin. Pour trouver le plus court chemin lui-même (l'itinéraire), 
il convient de partir du sommet initial dans la direction de décrois- 
sance des indices. 

On voit à la figure 2-4,c un exemple de marquage des points et. 
de recherche du plus court chemin pour m = 3. 

Notons que le procédé de recherche du chemin de longueur mini- 
male décrit ci-dessus est un cas particulier de la recherche de la 
solution optimale par la méthode de programmation dynamique. 
Aussi, après avoir étudié la programmation dynamique, serait-il 
profitable de revenir à l'exemple que l’on vient de considérer. 


c) Recherche du plus court chemin 
dans un graphe à arêtes de longueur arbitraire 


Le marquage des sommets d’un graphe avec des indices numéri- 
ques devient plus compliqué si les arêtes du graphe sont de longueur 
arbitraire. Ceci tient à ce que, dans un graphe complexe, le chemin 
passant par le plus petit nombre de sommets s'avère quelquefois 
plus long que certains chemins de détour. C’est ainsi que, dans le 
graphe de la figure 2-6, le chemin direct du sommet marqué avec un 
astérisque au sommet terminal a la longueur ! — 12, tandis que le 
chemin de détour passant par le sommet marqué d'un triangle a la 
longueur ! — 10. 

LA procédure de marquage pour un graphe de ce type consiste 
dans ce qui suit [12, 15] : 

1. Associons à chaque sommet zx; un indice À;. Le sommet ter- 
minal x, a d’abord l'indice À, = 0. Pour les autres sommets, posons 
en attendant À; — oo (i 0). 

2. Cherchons un arc (xi, z;) tel que À; — À; > l'(xi, xj) et 
substituons à l'indice À; l'indice À; = À; + L'(xi, zj) << A. Nous 
poursuivrons ce processus de substitution d'indices tant qu'il nous 
reste au moins un arc pour lequel À; peut être diminué. 
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Soulignons une propriété importante que possèdent les indices 
des sommets. Soit x, un sommet arbitraire. Au cours du marquage 
décrit ci-dessus, l'indice À, décroît de façon monotone. Supposons 
que z, soit le dernier sommet ayant contribué à la diminution de cet 


Fig. 2-6. Carte routière 


indice. Alors À, = À, + L (xs, x). Donc, pour un sommet arbitraire 
zP affecté d'indice À, il y a un sommet zx, relié par une arête à x, 
et tel que À, — À, = L'(xzo, tp). 

Cette propriété permet de formuler la règle suivante de recherche 
du plus court chemin. 

Soit z, — a un sommet initial d'indice À,. On cherche un sommet 
Zp, tel que À, — Àp, = L(2 / Zn). On cherche ensuite un sommet 


zh, vel que Àp, — Àp, = 1 (tp, Tp,), et ainsi de suite, jusqu'à gagner 
le sommet terminal x,,,, = zo = b. Le chemin u5 = (x, tp, . .. 
++. Tp,» To) de longueur À, est le plus court. 
Pour le démontrer, considérons un chemin arbitraire de a à b: 
D — (fn; Zn, + + + Th,» To). Sa longueur est ! (1). Conformément à 
la règle de marquage, les inégalités suivantes seront vérifiées : 
}n — An LÜ(Tns Th) ; 


Âns — An LT (This The) ; 


(2-14) 
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Additionnant ces inégalités terme à terme, on trouve que pour 
tout chemin pu 


An — 0 & 1 (u). (2-12) 


Parce qu’il vérifie la condition À, — L (u,), le chemin u, est 
le plus court. 

La méthode de recherche du plus court chemin est illustrée par 
la carte routière mise sous la forme d’un graphe à la figure 2-6. 
Les chiffres affectés aux arêtes indiquent le temps de parcours de 
chacun des chemins. Les indices des sommets fournissent le temps de 
parcours du sommet donné au sommet terminal. 


d) Construction du graphe de longueur minimale 


Nous passons maintenant à un problème de grande importance 
pratique, qui se présente sous la forme du problème du tracé des 
chemins. Il s’agit de relier plusieurs villes a, b, c, . . . entre elles 
par un réseau de routes. On connaît pour chaque couple de villes 
(z, y) le coût Z (x, y) de la construction de la route joignant ces 
villes. Le problème est de construire un réseau à minimum de frais. 

Au lieu du réseau de routes, on peut considérer un réseau de 
lignes de transmission d'énergie électrique, un réseau de pipe-lines, 
etc. Si, dans le graphe représentant le réseau de routes, nous 
donnons à la quantité L (x, y) l'appellation de longueur d'arête 
(x, y), nous aboutissons au problème de construction du graphe 
de longueur minimale. Aussi, au lieu du coût de construction, 
parlerons-nous par la suite de la longueur des arêtes du graphe. 

S'il n’y a que trois sommets a, b, c, il suffit de construire entre 
eux une seule chaîne abc, acb ou bac; si bc est l’arête la plus longue, 
on doit l’éliminer en construisant la chaîne bac. 

Le graphe de longueur minimale est toujours un arbre, car, 
s'il contenait un cycle, il serait possible de supprimer une des arêtes 
de ce cycle sans que les sommets cessent d’être réunis. Par conséquent, 
si l’on veut réunir rz sommets, on doit tracer rz — 1 arêtes. 

Montrons que le graphe de longueur minimale peut être cons- 
truit à l’aide d’une règle suivante [14]. Relions tout d'abord l’un 
à l’autre les deux sommets les plus voisins: l’arête est w,. À chaque 
pas suivant, ajoutons-y la plus courte des arêtes u; qui, jointe aux 
arêtes déjà existantes, ne constitue avec celles-ci aucun cycle. S'il 
y a plusieurs arêtes de même longueur, choisissons-en une arbitrai- 
rement. À chaque arbre Q ainsi construit on donne le nom d'arbre 
économique. Sa longueur est égale à la somme des longueurs des 
arètes isolées : 


L(Q)= L (us) + + (un). (2-13) 


5—0732 
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Montrons qu'aucun autre arbre reliant les mêmes sommets ne 
peut avoir la longueur inférieure à celle de l'arbre économique 
Q. Soient P l'arbre de longueur minimale reliant les sommets con- 
sidérés, et Q un arbre économique quelconque. Supposons qu'on 
a numéroté les arêtes u,, Us, . . ., Un, en conservant la succession 
dans laquelle elles ont été tracées à la construction de Q, c.-à-d. 
qu'elles vérifient la condition L (u;) < l'(ux+;). Si l'arbre P ne 
coïncide pas avec Q, cela veut dire 
que l'arbre Q possède une arête 
au moins n'appartenant pas à P. 
Soient u; — (a, b) une première 
arête de cette espèce et ZL (a, b) la 
chaîne sur le graphe P, reliant les 
sommets a et b, comme par exem- 
ple sur la figure 2-7. Ajoutant l’a- 
rête u; à P, on voit se former un 
Fig. 2-7. Pour illustrer la cons- Cycle; or, puisque Q est démuni 
truction de l'arbre de longueur de cycles, ce cycle nouvellement 

minimale formé doit contenir une arête au 

moins n’appartenant pas à Q. Suppo- 

sons que ce soit par exemple ui. Supprimant cette arête, on 

obtient un arbre P” ayant le même nombre de sommets que P 
et dont la longueur est égale à 


L(P)=1(P)+l(u;) —1(ui). (2-14) 
On sait que le graphe P a la longueur minimale. Donc 
Lu) > (ui). (2-15) 


Or, u: était considérée comme la plus courte arête qui, jointe 
aux arêtes U,, Us, . . ., Uj-3, ne donnait naissance à aucun cycle. 
Comme, en ajoutant u: à ces arêtes, on ne crée aucun cycle non plus, 
il vient 

L(u;) = l(ui) (2-16) 
et P° a, de même que P, la longueur minimale. Or, P’ a avec l'arbre 
économique Q une arête commune de plus que P. Reprenant cette 
opération plusieurs fois, on aboutit à un arbre de longueur mini- 
male qui coïncidera avec Q. Par conséquent, Q est bien l’arbre de 
longueur minimale. 


2-3. RÉSEAUX DE TRANSPORT 


a) Notions principales 
On entend par réseau de transport un graphe fini sans boucles 
caractérisé par: 
1) un sommet et un seul zx, tel que Lt x, — @ (ce sommet 
s'appelle entrée du réseau); 
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2) un sommet et un seul z tel que l'z — @ (il s'appelle sortie du 
réseau) ; 

3) un nombre entier c (u) rapporté à chaque arc « du graphe et 
appelé capacité de l'arc u. 

A la notion de réseau de transport est étroitement liée celle de 
flot. Soit x un sommet quelconque. Désignons par U: l’ensemble 
des arcs incidents à x vers l'inté- 
rieur, et par U; l’ensemble des 
arcs incidents à zx vers l’exté- 
rieur. Le flot dans le réseau est 
la fonction œ(u) vérifiant les 
conditions 


0<p(u)<c(u), uEU; (2-17) 
© tu) X F(u)=0; 
uEUx uEUX 
TÆL, LI 2. (2-18) 
La fonction œ(u) peut être 


considérée comme la quantité de 
matière passant (à l'unité de 


+] 
J _ 
temps) par l'arc u = (x, y) de x À NE" NN 


vers y. Conformément à la con- o/ 2 17 27 
dition (2-17), cette quantité ne 7, d } / on 1 52 1 
peut être supérieure à la capacité 6773," 3 44 
c(u) de l'arc. Suivant la con- +0 _t 
dition (2-18), la quantité de 
matière arrivant à chaque som- 6) 

met z autre que l'entrée x, et Fig. 2-8. Répartition des flots dans le- 
la sortie z doit être égale à la réseau de transport 


quantite de matière partant de 
ce sommet. Par conséquent, la matière ne peut s’accumuler nulle- 
part dans le réseau, si ce n'est à l'entrée et à la sortie. Or, cela si- 


gnifie que le flot sortant du sommet d'entrée x, est exactement égal 
au flot entrant dans le sommet de sortie z: 


À qu)= À pu) =. (2-19) 
uEUx, uEU, 


La quantité p (z) porte le nom de valeur du flot dans le réseau 
de transport. 

Un exemple du réseau de transport est donné sur la figure 2-8. 
Les chiffres placées dans les coupures des arcs indiquent la capacité 
de l'arc. Les flèches indiquent la direction des flots, et les chiffres 
affectant les flèches, la valeur du flot. C'est par analyse d’un réseau 
de transport qu'on trouve la solution de nombreux problèmes de: 


5%: 
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planification des livraisons, de distribution des marchandises entre 
les consommateurs, etc. 

L'étude de la répartition du flot dans le réseau de transport 
se trouve grandement facilitée après l'introduction de la notion de 
coupe du réseau. Soit À X un ensemble vérifiant les conditions 


T0 é À, Z € À. (2-20) 


Désignons par U; et U les ensembles des arcs incidents à À 
respectivement vers l’intérieur et vers l’extérieur. C'est à la totalité 
des arcs U, = Ux |] UA qu'on donne le nom de coupe À du réseau 
de transport. A la figure 2-8 on voit un exemple de coupe. 

Du moment que toute particule de matière allant. de x, vers 
z passera sûrement par l’un quelconque des arcs de la coupe, le flot 
total dans la coupe sera égal à la valeur du flot dans le réseau, c.-à-d. 
que pour toute coupe À on a 


p= à p(u)— Ÿ q{u). (2-21) 
uEU'A uEUA 


La capacité de la coupe À est la somme des capacités des arcs 
faisant partie de la coupe: 


c(4)= à c(u). (2-22) 
uEU'A 


Puisque pour tout arc q (u) < c (u) , il résulte de (2-21) et de 
(2-22) que 
Pz < C (4). (2-23) 


b) Problème du flot maximal 


Le problème du flot maximal dans un réseau de transport con- 
siste dans la recherche de la valeur du plus grand flot dont est capable 
le réseau et de la répartition de ce flot suivant les arcs du réseau, 
la configuration du réseau et les capacités de ses arcs étant connues. 

Lemme. Si pour une valeur quelconque du flot dans un réseau de 
transport q, et une coupe donnée V la condition q, = c (V) est rem- 
plie, le flot @. est maximal et la coupe V a la capacité minimale. 

Démonstration. On a vu que la valeur du flot @. pour 
toute coupe À doit vérifier la relation (2-23). Désignons par V la 
coupe de capacité minimale 


c(V) = min c(4). (2-24) 


La valeur du flot ®, étant la même pour toute coupe du réseau 
de transport, l'accroissement de la valeur du flot @, n'est possible 
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que jusqu’au moment où il atteint la valeur c (V). Donc, la valeur 
du flot 
g: = c(V) (2-25) 


définit justement le flot maximal dans le réseau de transport. 

Le lemme que l’on vient de considérer ne fournit cependant pas 
de méthode pratiquement acceptable pour la recherche du flot maxi- 
mal. Pour formuler cette méthode, faisons intervenir encore quelques 
définitions auxiliaires. 

Nous dirons d’un arc u qu'il est saturé quand œ (u) = c (u), et 
d’un flot æ, qu'il est complet lorsque tout chemin de x, à z passe au 
moins par un arc saturé. 

Le flot complet dans le réseau de transport donné n'est pas une 
quantité bien déterminée: il dépend de la direction des flots 
dans les différents arcs. Par exemple, on voit sur la figure 2-8,a et c 
deux répartitions différentes du flot dans le même réseau de trans- 
port. Les arcs saturés sont représentés par des lignes grasses. Dans 
les deux cas les flots sont complets bien que leurs valeurs soient 
différentes. 

L’algorithme pour la recherche du flot maximal, proposé par 
Ford et Fulkerson [15], consiste à faire accroître progressivement le 
flot æ, jusqu'à ce qu'il devienne maximal. Ce faisant, on admet que 
les capacités des arcs c (u) s'expriment par des nombres entiers, de 
sorte que les flots dans les arcs seront aussi des nombres entiers. 
On cherche le flot maximal en deux étapes. 

1. Détermination du flot complet. Supposons que œ (u) soit une 
certaine répartition du flot dans les arcs du réseau de transport. 
Cherchant un chemin pu de x, à z tel que tous ses arcs soient insaturés, 
on admet que 


p(u)+1 quand ue; 


p(u) quand u{u. (2-26) 


P = 


Le flot @. varie alors jusqu’à atteindre la valeur @: = @, + 1 > 
> .. On augmente de cette manière progressive le flot p, jusqu’à ce 
qu'il devienne complet. 


Exemple 2-3. Cherchons le flot complet dans le réseau de transport de la 
figure 2-8,a. On considère successivement quelques chemins en marquant les 
arcs saturés en trait gras: 

Mi = (os Zas Zss 2), P (la) = 1; arc saturé (z5, 2); 

Mo = (Zur Tes Zas Ts 2), P (u+) = 1; arcs saturés (z,, z:) et (xs, 2); 

Ma = (Zos Tes Ta, ©); pour que ce chemin soit saturé, on peut prendre 
o (3) = 2; arc saturé (r., rj). 

Il est facile de voir qu’il n’y a plus aucun chemin de x, à : qui contienne des 
arcs insaturés. Donc, le flot complet 


P: = P (la) + P (ua) + p (hs) = 4. 
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2. Détermination du flot mazimal. Soient ®, le flot complet et 
 (z, y) le flot dans l'arc u — (x, y) dirigé du sommet zx vers le som- 
met y. Le processus d'accroissement de ®@, se ramène à attribuer aux 
sommets du graphe des indices indiquant le chemin qui rend pos- 
sible l’accroissement du flot. On doit préalablement numéroter tous 
les sommets du graphe. 

Donnons à x, l'indice 0. Si x; est un sommet déjà marqué, on 
attribue l'indice +i à tous les sommets non marqués auxquels abou- 
tissent des arcs insaturés incidents à x, vers l'extérieur, c.-à-d. aux 
sommets y pour lesquels 


(ti, y)EU et (xi, y) <cC(xi, y) (2-27) 


et l'indice —i, à tous les sommets non marqués d’où partent des arcs 
incidents à x; vers l'intérieur, c.-à-d. aux sommets y pour lesquels 


(y, 2) EU et P (y; Ti) > 0. (2-28) 


Si, à la suite de ce processus, on constate que le sommet z est 
marqué, on peut être sûr de trouver entre x, et z une chaîne dont tous 
les sommets sont distincts et (au signe près) sont porteurs des numéros 
des sommets précédents. Faisons accroître d’une unité le flot dans 
toutes les arêtes de cette chaîne dans la direction de x, vers z en 
admettant que 


p(u)=pu)siuéu; 
pu) =pu)+1siuen 


et qu’en allant de x, vers z on parcourt l’arc w dans le sens direct de 
son orientation : 


pu) =p(u)—-1siuen 


et qu'en allant de x, à z on parcourt l'arc w dans le sens inverse de son 
orientation. 

A la suite de ce processus on obtient un nouveau flot dans le 
réseau q: — @, + 1, ce qui signifie que la valeur du flot croît. 
Ensuite, on reprend ce processus. 

S’il s'avère impossible d'accroître un flot @{ par la méthode pro- 
posée, c.-à-d. d’attribuer un indice au sommet z, alors œ° est le flot 
maximal dans le réseau. En effet, soit V l’ensemble des sommets non 
marqués, dont fait partie bien sûr le sommet z. Par conséquent, 
V est une coupe telle qu'aucun arc n’y est incident vers l’extérieur 
(dans le cas contraire certains sommets de cette coupe seraient mar- 
qués avec les indices négatifs) et que tous les arcs incidents à cette 
coupe vers l'intérieur sont saturés: 


Uy-Uy;, Uÿ=o; 


p(u)=c(u) pour ueEUry. l (2-29) 
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On a en outre 


= 2 plu) D q(u)= À c(u)—0=c(V). (2-30) 
uEUy ueUYy uçUy 


En vertu du lemme démontré ci-dessus, @£ est le flot maximal et 
V la coupe de capacité minimale. 


Exemple 2-4. On a marqué les sommets d’un réseau de transport comme il 
est montré sur la figure 2-8,a. Le sommet z est affecté de l'indice +4. La suite 
décroissante d'indices +4, —3, +2, +0 définit la chaîne nu = (x, zs, Ty Za, 2) 
dans laquelle il convient d'augmenter d'une unité le flot de x, jusqu’a :. Ce 
faisant, on obtient la répartition du flot montrée sur la figure 2-8,b. Reprenant 
la procédure de marquage sur cette figure, on trouve la chaîne up = (25, Zo, Zi, 
za, T4, 2) dont le flot doit lui aussi être augmenté d'une unité. La répartition du 
flot qui en résulte est montrée sur la figure 2-8,c. Deux sommets z, et z ne sont 
pas marqués sur cette figure. 

Ainsi donc, la répartition du flot obtenue assure le flot maximal 2 dans 
le réseau de transport considéré et l’ensemble V = {z,, z:} définit la coupe de 
capacité minimale. On trouve la valeur du flot ° après avoir déterminé la capa- 
cité de la coupe V: 


D=c(zn rc (rs r)+e (rs, 2) =34+1+2—6. 


L'augmentation du flot maximal dans le réseau de transport peut être réa- 
lisée en augmentant la capacité de l’un quelconque des arcs incidents à la cou- 
pe V vers l’intérieur. 


c) Problème de transport 


À côté du problème de recherche du flot maximal, une grande 
importance pratique est attachée au problème de la répartition la 
plus économique d’un flot suivant les arcs du réseau de transport, 
désigné sous le terme de problème de transport. Le réseau de transport 
représentant dans bien des cas le schéma d'organisation des trans- 
ports d’une marchandise quelconque, la solution du problème de 
transport permet de déterminer le plan le plus rationnel de transport, 
c.-à-d. la répartition des itinéraires qui assure, par exemple, le 
coût minimal du transport, ou bien la livraison des marchandises au 
client en un temps aussi court que possible. Le problème du premier 
genre est dit problème de transport à minimum de frais, et celui du 
deuxième genre, problème de transport à minimum de temps. 

Pour faciliter l'exposé, adoptons les désignations c;; = c (x;, x;) 
pour la capacité de l'arc (x;, z;), et di, = d (x;, x;) pour le coût de 
passage de l'unité de flot suivant l'arc (x;, x). 

Le problème de transport à minimum de frais se formule, en termes 
de la théorie des graphes, de la manière suivante. 

Soient donnés un réseau de transport caractérisé par le flot maxi- 
mal q‘ et un flot . < q° qu'il s’agit de faire passer par ce réseau. 
On demande de savoir une répartition du flot , suivant les arcs du 
reseau telle qu'elle assure le coût minimal de passage du flot. On 
demande en outre que soit vérifiée, pour chaque arc, la relation 
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p (xs, zj) € C;5 et que le coût de passage du flot @ (x;, x) suivant 
l'arc (x;, x;) soit égal à d;; q (x;, x;). 

Pour résoudre ce problème, considérons les quantités d;; comme 
{ongueurs des arcs correspondants. Dans ce cas, le coût de passage du 
flot ç par un chemin quelconque pu entre x, et z sera égal au produit 
de la longueur du chemin par la valeur du flot œ et le problème 
de minimisation du coût de passage du flot sera ramené à la recherche 
du chemin de longueur minimale dans le graphe de x, à z, problème 
auquel on a eu affaire un peu plus haut. Dans le cas où aucune restric- 
tion n’est imposée à la capacité des arcs, le plus court chemin est 
justement celui qui assure le coût minimal de passage du flot. 

S'il y a des restrictions imposées à la capacité des arcs, le problème 
est résolu en quelques étapes, par la recherche des flots partiels 
à chaque étape. Dans sa forme générale, le mode de résolution du 
problème consiste dans ce qui suit. 

Dans le graphe G, = (X, l) représentant le réseau de transport 
aux arcs de longueur d;; = L(x;, x;), proposons-nous de chercher le 
chemin le plus court u, de x, à z. Soit c, la capacité du chemin u.. 
On fait passer par ce chemin un flot 


= | Pz si PL C1 ; 
n— CO Si P >cC4. 


Si p: < C1, le problème est résolu et le chemin u, est le plus éco- 
nomique pour le flot .. 

Si @, > ©, le flot p, est considéré comme un flot partiel et on 
passe au graphe G, obtenu à partir de G, en remplaçant les capacités 
des arcs c;; par c;; tirées de la relation 


, Cij —C, Pour UE; 
Ci: = 
s Cij pour ul. 


(2-31) 


(2-32) 


Les arcs pour lesquels ci; — 0 ne sont pas pris en considération. 
On admet que le flot dont on cherche la répartition dans le graphe G, 
est égal à 

F2 = Pz — Pre (2-33) 

Maintenant, on aborde de nouveau le problème initial de recher- 
che de la répartition la plus économique du flot @: mais déjà dans 
le graphe G.. La solution de ce problème fournit le chemin u, de 
capacité c. suivant lequel on fait passer le flot partiel 


pe Si PL; 
Be si ge. 
Si p: < Ce, le problème est résolu, et la répartition la plus écono- 


mique des flots dans le graphe G, consiste à canaliser le flot , suivant 
l'itinéraire u, et le flot @, suivant l'itinéraire pu. 


(2-34) 
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Si p: > c>, il convient de passer à un nouveau graphe G, et de 
chercher un nouveau flot partiel .. Ce processus est renouvelé 
jusqu’au moment où la somme des flots partiels devienne égale 
à æ.. Ces flots partiels passés à travers le graphe G, représentent 
justement la répartition la plus économique du flot .. 

Pour illustrer la méthode décrite, considérons une variante lar- 
cement répandue du problème de transport à minimum de frais. 

Une marchandise homogène est stockée aux stations xz,, ..., ïm 
en quantités a, .- .., 4m. On demande de transporter cette marchan- 
dise aux stations y], . .., y, en quantités b,, ..., b,. On suppose 
que la quantité totale de marchandise à expédier soit égale aux 
réserves disponibles : 


m 
Sa=)" b;. (2-35) 
—1 j=1 

Le coût de transport de la marchandise de la station x; à la 
station y; est égal à d;;. On demande de fixer les itinéraires de trans- 
port les plus économiques. Il est commode d'écrire les données ini- 
tiales sous la forme d’une table (voir tableau 2-1). 


Tableau 2-2 
Tableau 2-1 D + ee 
, Données initiales au problème 
Problème de transport de transport 
b; b ; 
a: ee a: a 
b: | ... | b, 5 | 10 | 20 | 15 
a; | dit | .. | dir 10 | S | 3 | 5 | 2 
[ep pe 5 |slilel 
Am dm { dmr 25 | | 9 4 3 


Le réseau de transport correspondant à ce problème est construit 
de la façon suivante. On relie l'entrée zx, à chacun des sommets z; 
par un arc de capacité c (x,, x;) = æ&. On relie ensuite chacun des 
sommets y; à la sortie z par un arc de capacité c(y;, z) = b;. Le coût 
de passage du flot suivant les arcs (x,, x;) et (y;, z) est considéré com- 
me nul. Enfin, chaque sommet zx; est relié à chaque sommet y}, 
par un arc de capacité infinie; le coût de passage de l'unité de flot 
par cet arc est égal à d;;. Ceci fait, on applique au réseau de transport 
ainsi constitué la méthode décrite ci-dessus. 


Exemple 2-5. On demande de trouver lesitinéraires les plus économiques. 
pour le problème de transport résumé au tableau 2-2. Ce tableau correspond au 
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Tableau 2-3 


Répartition des flots partiels dans le problème 
de transport à minimum de frais 


k Itinéraire Flot partiel d Coût de trans- 
(x; y; Pr ëJ port d; ;0y 
1 (Z3, y1) 5 1 5 
2 (Zo, Ya) 40 | 10 
3 (z4, ya) 40 2 20 
4 (Z3, y4) 5) 3 45 
2 (z3, y3) 15 4 60 
6 (Ze, y3) 5) 6 30 
_ | _ 50 | — 140 


schéma ferroviaire (fig. 2-9) reliant les usines d’éléments de construction aux 
consommateurs de ces éléments (chantiers). Le réseau de transport correspondant 
aux données du tableau 2-2 est représenté sur la figure 2-10. 

Appliquant la méthode décrite ci-dessus, on trouve les flots partiels et 
les itinéraires, énumérés dans le tableau 2-3 dans l’ordre de leur obtention. Le 
plan des transports correspondant à 
ce tableau est montré aussi sur le 
schéma ferroviaire. 


Il est facile de voir que dans 
le cas général le coût de transport 
des marchandises suivant le ré- 
seau du type considéré se définit 
par l'expression 

m La 


à à di (ri, y). (2-30) 


1—= 12 


On en conclut que la méthode 
proposée de résolution du pro- 
Fig. 2-9. Schéma ferroviaire blème de transport fournit en 
principe le mode d'obtention des 
valeurs des flots partiels  (x;, y;) minimisant la somme mention- 
née. Ce mode n'est pas unique: dans le chapitre consacré à la 
programmation linéaire nous aurons l'occasion d’étudier quelques 
autres méthodes de résolution de problèmes analogues. 

Le problème de transport à minimum de temps sera examiné dans le 
réseau de transport résumé au tableau 2-2; les quantités d;, seront 
considérées désormais comme le temps nécessaire au transport de la 
marchandise du point x; au point y; et notées par t;, dans le texte 
qui suit. De pareils problèmes se présentent lorsqu'il s’agit de trans- 
porter des produits à durée de conservation limitée, d’expédier des 
moyens de secours dans les zones sinistrées, d’acheminer les céréales 
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nouvellement récoltées aux moulins, etc. Dans tous ces cas on exige 
de faire parvenir toutes les marchandises à destination en un temps 
aussi court que possible. 

Considérons le mode de résolution général de ce problème. Sup- 
posons que l’on ait trouvé, par une méthode quelconque, une répar- 
tition du flot æ. dans le graphe G représentant le réseau de transport 


Fig. 2-10. Solution du problème de transport à minimum de frais 


considéré. Délimitons sur G un graphe partiel G” ne comprenant que 
les arcs par lesquels est transmis le flot p.. Soient u un chemin allant 
de x, à z, et {,, le temps de parcours du flot suivant ce chemin. Il 
est évident que le temps nécessaire au transport de toutes les marchan- 
dises de zx, à z est défini par le chemin parcouru par le flot à maximum 
de temps, car le transport des marchandises suivant les autres che- 
mins s'effectue plus vite. Donc, le temps 7 nécessaire pour transporter 
toutes les marchandises est égal à 
T = maxé,. (2-37) 
p£eG? 
De cette façon, la solution du problème de transport à minimum 
de temps s'obtient en dégageant du graphe G un graphe partiel G’ 
tel qu'il puisse être parcouru par le flot , tout entier et dans lequel 
la durée du chemin le plus prolongé soit minimale par rapport 
à tous les autres graphes de cette nature. I] peut se trouver d’ailleurs 
que la solution trouvée ci-dessus en recherchant le minimum de 
frais et qui minimise la quantité définie par l'expression (2-36) ne 
sera point optimale au point de vue de l'impératif du temps minimal. 
La résolution du problème posé se ramène à perfectionner pas 
à pas le graphe G’ en supprimant dans celui-ci les chemins les plus 
prolongés et en y ajoutant des chemins plus courts mais non uti- 
lisés auparavant, et à répartir convenablement le flot œ.. 


Revenons au même exemple. En qualité de première approximation de la 
solution optimale, adoptons la solution trouvée en recherchant le minimum de 
frais. On voit à la figure 2-10 la répartition des flots pour ce cas. On remarque 
que le temps de parcours du flot suivant l'itinéraire le plus prolongé (x2, y) 
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est égal à 6. Or, il y a des itinéraires moins prolongés (r;, ye), (z3, ya) (z1, y3) 
qui n’ont pas été utilisés. Il est donc possible que l'un quelconque de ces iti- 
néraires puisse être substitué à (7,, y3). 

Construisons un graphe partiel G’ ne comprenant que les arcs à t,; < 6 
du graphe G; la répartition du flot restera la même que dans G. Le graphe GC’ 


Fig. 2-11. Solution du problème de transport à minimum de temps 


est représenté sur la figure 2-11 où les sommets y; sont désignés, pour plus de 
commodité, par Zm+j — Z3+. Le flot p; dans ce graphe est égal à 45 unités, 
donc inférieur au flot initial @. — 50 unités. Ce flot est complet, car tous les 
chemins dans G”’ allant de x, à : contiennent des arcs saturés. Il n’en est pas 
moins possible qu'il ne soit pas maximal. 

Si le flot maximal dans Îe graphe GC’ est égal à @., on peut être sûr de trou- 
ver une répartition de ce flot telle que le chemin le plus prolongé prendra t, < 
< 6 unités. Il reste maintenant de trouver le flot maximal dans G'. 

On voit sur la figure 2-11 les sommets du graphe G’ affectés d'in- 
dices d'après Je règle gnoncée au 
paragraphe 2-3. Les indices témoi- 

Tableau 2-4 gnent de l'existence d'un chemin 
Répartition des flots partiels dans le (Tor Zos Tes T3 Ze, :) qui permet 


problème de transport à minimum d’accroître le flot de xs jusqu'à 
de temps z de 5 unités. Ce flot supplémen- 

taire est montré par des flèches. 

Temps de On voit que le flot maximal 

Itinéraire Flot partiel pRrqours dans G’ est égal à œ:—50 unités 
no et l'itinéraire le plus prolongé dure 


4 unités de temps. IL n’est pas 
possible de diminuer davantage la 


ce pe) 10 1 durée de passage du flot, car, parmi 
(es. ) 5 3 les itinéraires aboutissant à y3 (xs), 
(ze y) 5 4 aucun n’a le temps de parcours 
(ra. 5) 20 4 inférieur à 4 unités. 


La répartition définitive des 

flots partiels suivant les itinéraires, 

fournissant la solution du problème 

— P: = 90 Îmax = de transport à minimum de temps, 
est résumée au tableau 2-4. 


CHAPITRE 3 


ESPACES MULTIDIMENSIONNELS 


3-1. ESPACES MÊTRIQUES ET DISTANCES 


a) Notion de distance 


Les ensembles ne peuvent être considérés comme collections de 
certains objets, ainsi qu'il a été fait au chapitre {, que d’une façon 
assez limitée, car tous les objets matériels de la nature se trouvent 
en liaison réciproque et en interaction. Aussi est-il nécessaire de 
définir l’ensemble au point de vue de l'établissement de telles ou 
telles relations entre ses éléments. 

On dit que l’ensemble est muni d’une # 
structure si certaines relations sont éta- 
blies entre ses éléments et que certaines 
opérations soient définies sur ces derniers. 

Un ensemble muni d’une structure porte q 
le nom d'espace. 

Nous allons commencer l'étude des pis. 341. Illustration de 
espaces par l’espace le plus élémentaire, l'inégalité triangulaire 
dit espace métrique. Pour définir celui-ci, 
on doit introduire la notion de distance des éléments d’un ensemble. 

La notion de distance est une notion bien familière à l’homme, 
qui associe cette notion à la manière de situer les objets dans l’espace 
et qui entend par distance la mesure d'’éloi- 
gnement des objets entre eux. Générale- 
ment, la distance d (M, N) entre deux points 
M et N a pour mesure la longueur du seg- 
ment reliant ces points (fig. 3-1). Or, bien 
souvent, une telle définition de la distance 
s'avère insuffisante. Même dans la vie quo- 
tidienne, par exemple, la distance entre deux 
villes ne peut être définie de façon univoque 
(distance par chemin de fer, par voie d’eau, 
etc.). Dans une ville partagée en pâtés de 
Fig. 3-2. Détermination ma sos comme il est montré sur la figure 
de la distance dans une 9-2 il n’y a aucun sens à relier les points 
ville divisée en pâtés de M et N par un segment de droite pour en 

maisons mesurer la distance, du moment qu’on ne 
marche que dans les rues. 

D'autre part, il arrive souvent qu’en disant « loin », « éloigné », 
on ne pense pas à l’espace dans le sens habituel du mot mais on parle, 
par exemple, du temps (« un passé lointain »...). Si un certain système 
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est susceptible de prendre successivement des états À,, A», . .- ., Ah, 
l'éloignement de l’état À, relativement à l’état À; peut avoir pour 
mesure le nombre d'états que le système doit prendre pour passer 
de l’état À; à l’état 4,. La distance est ici la mesure d’éloignement des 
états du système entre eux. Or, si l’éloignement est considéré comme 
une propriété de l’espace, on est amené à considérer non plus 
l'espace ordinaire à trois dimensions mais un espace de nature 
différente ; on peut l'appeler par exemple espace des états. 

Les exemples ci-dessus montrent qu'il doit exister une définition 
générale de la distance comme mesure d’éloignement d’objets et donc 
une définition générale de l’espace dans lequel ces objets existent, 
ces notions pouvant avoir une signification différente dans les diffé- 
rentes situations concrètes. Puisque les collections d'objets divers 
représentent des ensembles, les notions d'espace et de distance doi- 
vent être liées à celle d'ensemble. 


b) Définition de l’espace métrique 


Soit X un ensemble quelconque. La notion de distance entre les 
éléments de X résulte de la généralisation des propriétés fondamenta- 
les considérées intuitivement comme inhérentes à la distance et 
qu'on illustre clairement sur la figure 3-1. 

Faisons correspondre à tout couple d’éléments de X un nombre 
réel non négatif d > 0. Ce nombre est appelé distance ou métrique 
de À s'il satisfait, pour tous les x, y, z € X, aux trois conditions 
(axiomes) suivantes: 

1) dx, y) = 0 si et seulement si x — y (axiome d'identité); 

2) dx, y) = d(y, x) (axiome de symétrie); 

3) dix, y) L dx, z) + d(z, y) quels que soient zx, y, z2E€ X 
(inégalité triangulaire). 

L'espace métrique est le couple (X, d), c.-à-d. l’ensemble X 
à métrique d définie sur cet ensemble. Les éléments de l’ensemble X 
sont dits les points de l'espace métrique (X, d). 

Il découle de cette définition qu’un ensemble X ne devient un 
espace métrique que par l'introduction d'une métrique correspon- 
dante d (x, y). Introduisant dans un seul et même ensemble X diver- 
ses métriques, on obtient plusieurs espaces différents. C'est ainsi 
que les espaces représentés sur les figures 3-1 et 3-2 ont pour élé- 
ments les ensembles des points du plan mais possèdent des métriques 
différentes. 


c) Exemples d'espaces métriques 


1. Soient zx, y des éléments arbitraires de l’ensemble À des nombres 
réels. On peut faire de l’ensemble R un espace métrique en définis- 
sant la distance entre x et y par la formule 


dr y)=1z-—7yl|. (3-1) 
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C'est avec cette formule qu’on trouve la distance séparant des 
points de l’axe réel, qui est l’exemple le plus élémentaire d'espace 
métrique. 

2. Considérons l’ensemble À" qui a pour éléments des n-uplets 
crdonnés des nombres réels de la forme xz— (x, ..., x), 
y — (ÿ1, - - ., Yn). Il existe plusieurs procédés pour faire de À" un 
espace métrique. La distance entre les points x et y est définie le 
plus souvent par la formule 


de D=iZla-uêi (8-2) 


Pour r = 2, 3 cette définition se confond avec la notion géo- 
métrique habituelle de la distance. Les propriétés 1, 2, 3 pour cette 
distance sont évidentes (fig. 3-1). 

On appelle la métrique d, (x, y) métrique euclidienne, et l’espace R”" 
muni d’une telle métrique et noté E,, espace euclidien. 

3. Pour l’ensemble R” la distance peut aussi être définie autre- 
ment, par exemple: 


di (x, y) = à [ti — yi| (3-3) 
ou 
do (T, y) = max (|[xzi—wyl, ...,[Tn —Yn|). (3-4) 


I] est facile de voir que les métriques d,, d,, d. sont des cas par- 
ticuliers de la métrique 


ñn 
dh (x, y) = ps [x —y;lr} 7 


et s’obtiennent respectivement pour p = 2, p = 1 et p = oc. 

Les propriétés 1 et 2 pour les métriques (3-3) et (3-4) sont immé- 
diates. Pour démontrer la propriété 3, prenons en outre un point 
z = (z,, ..., Zn) € RT. La distance d, (x, y) s'écrit: 


n 
di(x, n=i [Ti—zi+z—yil< 


<> a-sl+ia-ul)=d(, à+4d(, y). 


Pour la distance d, & y) la propriété 3 se vérifie comme suit. 
Supposons que | x, — y, | soit la plus grande des différences cor- 
respondantes des points x et y. Alors 


dœ (x, y)= [2 — ynl= | —- 2m +R —-Yyl< 
L'|Zr — 2 | + | 2x — ya |. 
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Il est évident que 
[tr — 2 |Kmax(lz — 2], ..., [zx — 2 |) = de (x, 2); 
ÜZx — ÿYr | L'max (12 — Yi, - -., [Zn — Yn }) = dx (2, y). 
Donc, 

de (T; y) K de (7, 2) + dx (2, y). 


4. Considérons l’ensemble de toutes les fonctions du temps pos- 
sibles qui sont continues sur l'intervalle a < {  b. Soient zx (t) 
et y (t) deux fonctions de cette espèce. Leur distance s'exprime par 
la relation 


de, y)= max |2 (9 —u (| (3-5) 


qui satisfait à toutes les propriétés d’une métrique (cela est facile 
à vérifier). L'espace doté d’une telle métrique se note Cfa. b]- 

Pour illustrer les larges possibilités d'emploi des notions nou- 
vellement introduites, il y a lieu de considérer un espace dont l’im- 
portance en cybernétique est primordiale, à savoir l'espace des 
messages. 


3-2. INTERPRÉTATION GÉOMÉTRIQUE 
DES SIGNAUX ET DES MESSAGES 


a) Espace des messages 


Nous avons vu en Introduction que les messages sont transmis 
par les canaux de communication au moyen d’un alphabet % cons- 
titué par des symboles en nombre fini. Les messages représentent 
diverses suites de symboles alphabétiques. Le nombre de symboles 
dans le message est la longueur du message. 

Considérons un cas où l’on se sert d’un alphabet A,, comprenant 
m symboles pour transmettre des messages de longueur 7. On range 
parmi ces derniers aussi bien des messages plus brefs, à condition 
de les compléter jusqu’à nr par addition d’un symbole déterminé ; 
en notation binaire, ce sera le signe zéro. L'ensemble réunissant tous 
ces messages peut être assimilé à un espace métrique par l’introduc- 
tion de la notion de distance des messages. 

Convenons d'appeler distance d (x, y) de deux messages x et y le 
nombre de positions dans lesquelles les messages x et y ont des sym- 
boles différents. L'espace métrique ainsi obtenu sera noté E (n, %,,) 
et sera appelé espace des messages. 


Exemple 3-1. X,, est l'alphabet français, n — 7, z — (chapeau), y = (chàâ- 
teau). La quatrième lettre ne coïncide pas. Donc, d (zx, y) = 

Exemple 3-2. Soit Y — À, — (0, 1} l'alphabet Pinaire, n = 10, r = 
— 0100111010, y — 0010110010. Le deuxième, le troisième et le septième signe 
ne coïncident pas. Donc, d (x, y) = 
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La définition de la distance d (x, y) dans l’espace des messages, 
telle qu'on vient de la donner, satisfait à toutes les propriétés de la 
distance. L’axiome d'identité et l'axiome de symétrie sont immé- 
diats. Montrons qu'il en est de même de l’axiome d'inégalité trian- 
gulaire. 

Soient trois messages zx, y et z de longueur n. Soient z4, yr et Zn 
les symboles de ces messages en k-ième position. Il est naturel que 
Si Tr — Yr et Si Yr — Zn, ON ait Tr — Zn, C.-à-d. que si en position 
quelconque les symboles des messages zx et y et des messiges y et z 
coïincident, ils coïncident aussi dans cette position pour les messages 
x et z. Donc, pour les messages x et z les symboles non coïncidants 
ne peuvent se trouver que là où les symboles ne coïncident pas soit 
pour les messages x et y, soit pour les messages y et z. Or, cela signifie 
que le nombre total de symboles qui ne coïncident pas dans les 
messages z et z ne peut être supérieur à la somme des nombres de 
symboles qui ne coïncident pas dans x et y et dans y et z. 

Par la suite, dans le souci de rendre notre exposé plus simple et 
clair, nous nous bornerons au seul alphabet binaire A — Y, — 
— {0, 1}. On peut le faire sans restreindre la généralité des raison- 
nements, puisque les messages écrits par des symboles d’un alphabet 
quelconque peuvent toujours être transcrits au moyen de symboles 
d'un autre alphabet. Soit, par exemple, un alphabet A, à m sym- 
boles. Affectons chaque symbole d’un numéro d'ordre de 0 à m — 1. 
Substituant maintenant dans notre message aux symboles de l’a]pha- 
bet A, leurs numéros d'ordre en numération binaire, nous obtien- 
drons le même message écrit à l’aide de l’alphabet binaire. 


b) Codes à détection et à correction d'erreurs 


Au cours de la transmission par le canal de communication, le 
message peut être déformé. Dans le cas de l'alphabet binaire, la 
déformation se manifeste par l'apparition de quelques zéros à la 
place des unités et de quelques unités à la place des zéros. La question 
se pose de savoir s’il cst possible d'inventer des codes tels qu'ils 
puissent signaler les déformations subies par le message au cours de 
la transn ission ou même reconstituer les valeurs des bits mutilés? 

Considérons le cas où, lors de la transmission du message, il 
y à k bits déformés au plus. Dans l’espace des messages E (nr, %:), 
délimitons un sous-ensemble H,S E (7, A.) qui, pour tout x, y EH, 
vérifie l'inégalité 

d (x, y) > k. (3-6) 


L'ensemble H, sera dit ensemble des mots intelligibles, le terme 
« mot » ayant ici la même signification que le terme « message ». 
Alors tout x é H, est un mot inintelligible. Supposons qu'à .la 
transmission du mot x € H, ce-dernier a été mutilé et est devenu zx’. 


6—0732 
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Conformément à la condition selon laquelle le nombre de déforma- 
tions ne peut être supérieur à k, on a dx, r')<k et zx’ € Hs, 
c.-à-d. x’ est un mot intelligible. De cette façon, la réception d'un 
mot inintelligible témoigne d’une déformation qui a eu lieu pendant 
la transmission. Les codes vérifiant la condition (3-6) sont appelés 
codes à détection d'erreurs. 


Exemple 3-3. Dans l'ensemble E (3, ,), séparons l’ensemble des mots intel- 
ligibles verifiant la condition d (x, y) = 2; ce sera 


H, = {000, 101, 011, 110}. 


La déformation d’un chiffre quelconque dans ces mots les rend inintelligi- 
bles, permettant de détecter, par là même, une erreur unique. 

L'ensemble H, formant le code à détection d’erreur unique dans Ics mots 
de longueur n se construit de la façon suivante. Considérons l'ensemble E (#7—1, 
®), c.-à-d. l'ensemble des mots de longueur nr — 1. L'ensemble H, s'obtient 
en ajoutant à cet ensemble un chiffre supplémentaire choisi de façon que le nom- 
bre total d'unités dans les mots x € H, soit pair. 

Exemple 3-4. Pour n = 4, on a: 

E (3, %.) — {000, 001, 010, 100, 011, 101, 110, 111 }. 
Alors 
H, = {0000, 0011, 0101, 1001, 0110, 1010, 1100, 1111 }. 

Il est commode de chercher le mot déformé en effectuant l'opération d'addi- 

tion en module 2 d’après les règles 
0@0=-0; 0@M1=1; 1@0=1,;, 1B1—=0. (3-7) 


C'est ainsi que dans le mot x = a,a, ... a, la quantité 


B— a D & D ... D ün 


sera le zéro ou l'unité suivant que le nombre de symboles du mot ayant la va- 
leur de l'unité est pair ou impair. 


Remarquons que le code établi dans l'exemple 3-4, possédant 
quatre chiffres et détectant l'erreur, permet de former 2 — 16 mots 
différents au total ; or, de ce nombre, il n’y a que 8 mots intelligibles, 
c.-à-d. convenant à la transmission par le canal de communication. 
Les codes dans lesquels le nombre de mots intelligibles est inférieur 
au nombre total de mots possibles portent le nom de codes redondants. 
La redondance est une condition nécessaire de construction des codes 
à détection d'erreurs. 

On a pu construire aussi des codes permettant de corriger les 
erreurs commises. Supposons de nouveau qu'il n’y a que 4 bits du 
code qui ont été déformés au cours de la transmission. L'ensemble 
des mots intelligibles H, — E (nr, %.) se définit par la condition 


d (x, y) > 2k (3-8) 


pour tout zx, y € H:. 
Soient deux mots quelconques x, y € H;. Supposons que le mot x 
a été déformé en zx’. Alors d (x, x’) < k. De l'inégalité triangulaire, 
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on a: 
dx ,y)>d(z, y -d(2,x)>2k — k =k. (3-9) 
Par conséquent, 
dr, x’) < d(x’, y). (3-10) 


Ainsi donc, la distance entre le mot erroné x’ et le mot initial x 
est inférieure à la distance séparant x’ de tout autre mot intelligible. 
Trouvant le mot intelligible le plus proche de x’, on reconstitue le 
message initial x. Les codes vérifiant la condition (3-8) s’appellent 
codes à correction d'erreurs. Les problèmes de réalisation pratique des 
codes à correction d'erreurs sont assez compliqués et font l’objet 
d'ouvrages spéciaux [191]. 


3-3. ESPACES LINÉAIRES NORMES 


a) Espace linéaire 


Au commencement de ce chapitre, on a défini l’espace comme un 
ensemble muni d’une structure. On a considéré les espaces métriques 
dont la structure était définie par ce qu'à chaque couple d'éléments 
on associait un nombre réel possédant des propriétés déterminées 
et appelé métrique. Or, la métrique ne peut aucunement caractériser 
la totalité des propriétés structurales des différents espaces. En 
particulier, parmi les propriétés structurales importantes d’un 
ensemble X des nombres réels ou complexes, on signale la possibilité 
d'obtenir certains éléments de l’ensemble à partir d’autres éléments 
en additionnant ces éléments ou en multipliant un élément par un 
scalaire. Les ensembles jouissant de ces propriétés se rapportent à la 
classe des espaces linéaires. Les espaces linéaires doivent satisfaire 
aux conditions suivantes: 

1) quels que soient les éléments x, y € X, il leur correspond un 
élément et un seul z € X, appelé leur somme et noté x + y, tel que: 

z+y—y+zr (commutativité): 

z+(y+r)=(rx+y)+v (associativité); 

il existe dans X un élément 0 tel que x + 0 — x quel que soit 
z EX (existence d’un élément nul); 

quel que soit x E X, il existe dans X un élément —zx tel que 
z + (—zx) — 0 (existence d’un élément opposé): 

2) quels que soient le nombre « et l'élément x € X, il leur cor- 
respond un élément et un seul «x € X tel que 


(a + B) x = ax + fr; 
a (x + y) = ar + ay. 


Les conditions 1) et 2) portent le nom de conditions d'additivité 
et d'homogénéité de l’espace linéaire. 


G* 
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Donnons quelques exemples d'espaces linéaires: 

1. Ensemble des nombres réels R avec les opérations d’'addition 
et de multiplication définies de façon habituelle. 

2. Ensemble R, de tous les r-uplets ordonnés des nombres réels 
sur lequel les opérations d’addition et de multiplication par un 
nombre sont définies comme suit. Si x, y E R'et x — (x, ..., zh), 
ÿ = (Yi + es Un), alors ZT +y = (nm + ya -.., Zn + Yn); 
az — (az, ..., azx,). 

Pour r — 2 et n — 3, ces opérations coïncident avec les règles 
habituelles d'opérations sur des vecteurs. Le vecteur nul est le vec- 
teur (0, ..., O0) dont toutes les composantes sont nulles. 

3. Espace des fonctions Cfs, +] dans lequel, quels que soient 
z (t), y (t) E Cfa. by, On entend par somme x (!) + y (£) la Somme des 
valeurs de zx (£) et de y (t) prises pour les mèmes valeurs de f, et par 
fonction «zx (t), une fonction nouvelle résultant de (x) £{ par multipli- 
cation de toutes ses valeurs par &. La fonction nulle est la fonction 
f(t) = 0 s’annulant identiquement sur tout l'intervalle [a, bl]. 


b) Espace linéaire normé 


Un espace linéaire ne se trouve décrit de façon exhaustive qu’au 
moment où les propriétés d’additivité et d’homogénéité se complè- 
tent par la possibilité de mesurer les valzurs des éléments eux- 
mêmes. C’est ainsi qu’on ne peut comparer les vecteurs tant qu’on 
n’a pas convenu de la signification de la valeur (longueur) d’un 
vecteur. Introduisant dans l’espace linéaire des appréciations numé- 
riques de la valeur des éléments isolés, on aboutit à la notion d’espace 
linéaire normé, appelé parfois espace de Banach. 

Un espace linéaire est dit normé si pour tout x € X il existe un 
nombre non négatif || x ||, appelé norme de x et qui satisfait aux 
conditions suivantes: 

[x || = 0 si et seulement si x — 0; 

ax [= [al.lzli; 

Hz +y<llz 1 + 1 y Il Gnégalité triangulaire). 

On s’assure facilement que la quantité || z — y || possède toutes 
les propriétés de la distance d (x, y) dans l’espace métrique. En effet, 

zx — y] — 0 si z—y—0, c.-à-d. si x — y; 


se rappelant que y — zx — —(xz — y), on trouve: 
My —zl=l-1l-Nz-yi=Nz- y; 
Hz—yl=G—-2)+G-yI<Uz—-zl+z- y 


Ainsi donc, l’espace linéaire normé est un espace métrique muni 
d'une métrique 


dx, y=lz-7yll. (3-11) 
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Complétés des propriétés d'additivité et d'homogénéité, tous 
les espaces métriques considérés plus haut se transforment en 
espaces linéaires normés. Pour ces derniers il existe des notations 
spéciales, à savoir: 

1) espace C{") ou E, de norme 


' 


Ixl= IS Ia" où Nzl=lzl pour n—1; (8-42) 


2) espace C() de norme 
ñ 


Iz= 2 Il; (3-13) 


ii 
3) espace C7) de norme 
x = max {xt -.., [z |}: (3-14) 


4) espace Cfa, by des fonctions continues sur l'intervalle [a, b], 
de norme 


[= max | f (0). (3-15) 
a<t<b 


3-4. UTILISATION DES ESPACES MULTIDIMENSIONNELS 
DANS CERTAINS PROBLÈMES DE CYBERNÉTIQUE 


a) Lissage des erreurs des données expérimentales 


Le résultat de l’observation d’une grandeur physique y repré- 
sente le plus souvent une suite de valeurs mesurées de cette grandeur 
(z1, - -., zh) — zx, les résultats de mesure étant généralement enta- 
chées d'erreurs dues à l’imperfection de l'expérience et à l’influence 
de facteurs étrangers différents. La grandeur y elle-même peut ne 
pas demeurer constante mais varier selon une certaine loi. La tâche 
de l’expérience est la détermination d’une vraie valeur de la gran- 
deur en question. 

La situation décrite peut être représentée en termes de la théorie 
de la transmission des messages si y est considéré comme un certain 
message relatif à la valeur de la grandeur donnée, message qui a subi 
des déformations par suite de l’imperfection de l'expérience. Consi- 
dérant le message transmis y et la valeur reçue x comme des points 
de l’espace des messages, on peut apprécier le degré de déformation 
du message reçu d’après la valeur de la distance d (x, y), dont le 
mode de détermination est fonction de la nature de l’expérience. 
Dans la plupart des cas, on emploie la distance de la forme 


d(r, y) = V (1 y1) + + (tn —Yn)°, (3-16) 
pour laquelle l’espace des messages se transforme en espace C(). 
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.: En général, on arrive à établir, sur la base des considérations 

théoriques, l’ensemble Y des messages théoriquement possibles. On 

prend en qualité de message correct un y € Y tel qu'il soit le plus 
proche du message reçu x, c.-à-d. pour lequel 


d (x, y) — min (3-17) 
ou, ce qui est parfois plus commode, 
dd = (x, y) — min. (3-18) 


Le principe de recherche du message 
initial y par la formule (3-18) pour une dis- 
tance de la forme (3-16) connaît un large 
emploi sous la dénomination de méthode 
des moindres carrés [20]. 

En qualité d'exemple, prenons un cas 
Fig. 3-3. Détermination extrêmement important pour la pratique où 


des paramètres d'un si- ]; grandeur y varie suivant la loi linéaire 
gnallinéairement variable 
y = at + b. (3-19) 


Aux instants 4,, ..., 4, On mesure les valeurs y, = at, + b, 
k —= 1, ..., nr. On voit sur la figure 3-3 les résultats de mesures 
Lis + +) Tne 
Compte tenu de (3-19), mettons la condition (3-18) sous la forme 


Œ(r,y)=F(a, b)= D (xx —at, —b)} = min. (3-20) 
h=1 


Dans cette expression les inconnues sont les paramètres a et b 
de la loi linéaire de variation de y, qu'onest en train de chercher. 
Egalant à zéro les dérivées partielles par rapport à a et b de la fonc- 
tion F (a, b), on obtient deux équations renfermant les deux incon- 
uues; après la simplification, ces deux équations deviennent 


n n n 
° Q 
a Ÿ te + D > ln = D Euh 5 
k -1 k:! (3-21) 


pue amer ew” 


De (3-21) on tire sans peine les valeurs de a ct b qui nous inté- 
ressent. 


Un autre cas bien important a lieu lorsque la grandeur y demeure 
inchangée, c.-à-d. 


y = c = const (3-22) 
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et qu'on a fait z mesures indépendantes 2,,. . ., x, pour l’apprécier. 
Compte tenu de (3-16), la condition (3-18) s’écrira 
n 


Œ(x,y)=F(c)= 2 (xs — c)* = min. (3-23) 


Dérivant cette expression par rapport à c et égalant à zéro, on 
trouve: 


; ñn 
C = R À Th. (3-24) 


La valeur de c trouvée à l’aide de la formule (3-24) est la moyenne 
arithmétique des valeurs zx;, ..., z, 

Si la distance est déterminée d’une façon différente, on aboutit 
a des formules différentes de la moyenne. Pour plus de commodité, 
admettons que les valeurs zx,, . .., x, sont disposées dans l’ordre 
de croissance. Nous laissons au lecteur le soin de montrer qu'en 
déterminant la distance d’après la formule (3-3), la valeur moyenne 


| Tn+1 quand x est impair ; 
"2. 


C = | | (3-25) 
| toute valeur de 2, à zx quand nest pair. 
1 + 
\ 2 2 
Parfois, pour fixer les idées, on pose pour 7» pair 
1 » 
C—zGn ten) (3-26) 


Quand on détermine la distance d’après la formule (3-4), la 
formule de la moyenne se présente sous la forme: 
Ti+Tn 


C = 9 — . (3-27) 


b) Problème d'identification des images 


Le domaine de la cybernétique consacré à l'identification des images 
se donne pour but l'établissement du modèle d’une des propriétés 
fondamentales du cerveau humain: celle d'identifier objets, phéno- 
mènes et situations, grâce à laquelle l’homme s'oriente avec facilité 
dans les circonstances les plus compliquées [21, 22]. 

La théorie de l'identification est basée principalement sur les 
notions de classe et d'image. Les différents objets ou phénomènes de la 
réalité se distinguent les uns des autres d’après leurs propriétés ; 
ils possèdent, en revanche, aussi bien des propriétés communes 
permettant de grouper les objets en ensembles, ou classes. C'est 
ainsi que les voitures de tourisme, de sport, de course constituent la 
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classe des voitures. Les classes peuvent être plus ou moins générales 
suivant les propriétés qui les caractérisent. Par exemple, la classe des 
voitures est un élément d'une classe plus vaste des véhicules. Ainsi 
donc, on entend par classe un ensemble d'objets ou de phénomènes 
caractérisés par des propriétés communes. 

Dans chaque cas concret, on a affaire à une collection finie de 
classes exprimées par un ensemble fini 


W = {A, B, Ci, ..., P}. 


Toute classe contient un ensemble d'objets dont le nombre peut 
être aussi élevé que l’on veut et dont les propriétés sont très diverses. 
Or, en pratique, on n'arrive à prendre en considération qu’un nombre 
restreint, et souvent très faible, des différentes propriétés. Donnons 
à la collection des propriétés d’un objet en nombre fini l'appellation 
d'image de l’objet et représentons-la sous forme d’un vecteur à n di- 
mensions Z — (Zy, . . ., zh) dont les composantes constituent des 
caractéristiques quantitatives de l’image. Un exemple d'image est 
donné par la représentation d’une photographie à l'écran d’un télé- 
viseur divisée en » cellules indépendantes. Les brillances de ces cellu- 
les constituent ensemble un point dans l’espace à nr dimensions, 
point qui est justement l’image de la photographie. 

A condition que la collection choisie d'indices caractérise de façon 
suffisamment complète les propriétés des objets, on peut s'attendre 
à ce que la totalité des points correspondant aux différentes images 
d'une même classe occupe dans l’espace des images un domaine dis- 
tinct des domaines correspondant aux images d’autres classes. 

On considère que le problème d'identification des images est 
résolu en principe chaque fois qu’on a pu tracer dans l’espace des 
images les surfaces séparant cet espace en domaines dont les points 
appartiennent aux images de classes différentes. Une des méthodes 
possibles de résolution de ce problème consiste dans l'étude préalable 
des propriétés des échantillons isolés d'objets de chaque classe. 

Supposons qu’il n'y a que deux classes d'objets À et B. Désignons 
par À, et B, les ensembles des échantillons préalablement étudiés 
faisant partie de ces classes. Placés dans l’espace des images, ces 
échantillons se présentent, pour le cas de deux dimensions, comme 
il est montré sur la figure 3-4,a, où les points correspondant aux 
échantillons de À, sont marqués par des ronds, et ceux de B,, par 
des triangles. 

Soit x une image d’un nouvel objet à étudier. Prenons pour mesure 
de parenté de cette image envers les classes À et B les quantités 
S (x, A) et S (x, B) qui représentent, par exemple, les carrés moyens 
des distances séparant le point x des points correspondant aux diffé- 
rents échantillons des classes À et B. Etant donné que À, = 
— {a, ..., am} et B, —= {b1 ..., b;}, la formule (3-24) de la 
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moyenne nous donne: 


S(x, A=25S d(x, a;); 


i=1 


(3-28) 
S(z, B)=+ DE (x, b)). 


j=1 
Dans l’espace des images, les images des deux classes seront sépa- 
rées par une surface C dont les points satisfont à la condition 
S (x, A) = S (x, B). (3-29) 


Dans certains cas, la surface C est telle qu'une image sera identi- 
fiée avec erreur comme appartenant à une classe étrangère (voir 
fig. 3-4,a). Comme critère de qualité d'identification, on adopte le 
nombre relatif d'images incorrectement identifiées. 


72) 
III TITI. 
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Fig. 3-4. Division en classes de l’espace des échantillons 


Exemple 3-5. Dans chacune des classes À et B on a pris un échantillon 
a EAetb,€ B de telle façon qu'ils puissent exprimer dans l’espace bidimen- 
sionnel les propriétés les plus caractéristiques de ces classes. On demande de 
traccr la ligne partageant l’espace des images en deux domaines correspondant 
aux classes À et B. 

Proposons-nous de définir la distance d’après la formule (3-2) par la lon- 
gueur du segment reliant deux points dans l’espace des images. Conformément 
à (3-29), la ligne de partage doit avoir tous ses points à la même distance de a, 
et de b,. Ce se rala perpendiculaire dressée au milieu du segment reliant les points. 
ai et b, (fig. 3-4,b). 


3-5. IMAGES GÉOMÉTRIQUES 
DANS L'ESPACE MULTIDIMENSIONNEL 


a) Notion d’hypersphère 


Soit X un ensemble de points dans l’espace multidimensionnel. 
On entend par hypersphère une surface fermée dont tous les points se- 
trouvent à la même distance r d’un point fixé a. Donc, c'est un 


90 CH. 3. ESPACES MULTIDIMENSIONNELS 


ensemble X (a, r)= E,, défini comme suit: 
X (a r)= {EE :d(a, x) =r). (3-30) 


Le point fixé a est le centre, et r le rayon de l’hypersphère. L'’en- 
semble 


B (a, r) = {:E€E,:d{(a, x) <r} (3-31) 
est la partie intérieure de l'’hypersphère, ou boule ouverte. L'ensemble 
Bla,r]= {rEE:d(a, x) <r} (3-32) 


est appelé boule fermée. 
Une boule ouverte de rayon & centrée en x porte le nom de voisinage 
de z et se note V, (x). 


Exemple 3-6. Dans l’espace Es = {7,, x.}, l'équation de l'hypersphère 
puout s’écrire d° (a, x) = r°. La distance étant définie d'après la formule (3-7). 
l'hypersphère se transforme en une circonférence : (7, — a,)® + (rx, — a)? = r. 


b) Ensembles bornés et finis 


L'ensemble E, contenant tous les points innombrables de l’espace 
à nr dimensions sera appelé ensemble universel. Désignons par X un 
sous-ensemble de E,. On dit que X est borné si la distance séparant 
deux points arbitraires de cet ensemble est bornée, c.-à-d. s’il y a un 
nombre M tel que pour tout z'}, x € X on ait 


dx, 2) LA. (3-33) 


Pour que l’ensemble X soit borné, il faut et il suffit qu'il se 
trouve dans une hypersphère, c.-à-d. qu’il existe un point a et un 
nombre r tels que pour tout x € X on ait 


d(x, a)<r. (3-34) 


L'ensemble X est fini s’il contient un nombre fini de points. Un 
ensemble fini est toujours borné. 


Exemple 3-7. Dans l'espace E, l’ensemble X = {(r,, re) € Es 2:75 + 25 < 1} 
est un ensemble borné infini. 

Exemple 3-8. Dans l'espace E, l’ensemble X constitué par cinq points 
X = {(0,0), (0,1), (1,0), (1,1), (1/7, 1/2)} est un ensemble fini. 


c) Ensembles ouverts et fermés 


Un point z est dit intérieur à l’ensemble X s'il y a un voisinage 
V,(x) dont tous les points appartiennent à X. L'ensemble X dont 
tous les points sont intérieurs est dit ensemble ouvert. 


Exemple 3-9. L'intervalle (a, b) = {r€ R:a < r < b}, où R est un en- 
semble des nombres réels, est un ensemble ouvert. En effet, pour tout z € 
€ (a. b) le voisinage V, (x), où e — min (x — a, b — x), est contenu dans (a, b). 
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Eremple 3-10. La boule ouverte B (a, r) est un ensemble ouvert. En effet, 
si z£B (a, r), alors d'(a, x) <r. Posons e = r — da, r). Alors V,(x) — 
= B(r, &) CB (a, r). 


Le point zx est dit point limite de l'ensemble X si tout voisinage 
V, (x) de ce point contient une infinité de points de X. Si en outre 
z € X, c’est un point limite appartenant à X. Par exemple, tous les 
points intérieurs à l’ensemble X sont des points limites apparte- 
nant à X. 

Si x est un point limite de l’ensemble X et que zé X, c'est un 
point limite n’appartenant pas à X. Ce sera par exemple le cas des 
points a et b de l’ensemble (a, b). Un ensemble fini est dépourvu de 
points limites. 

Un ensemble X est dit fermé s'il contient tous ses points limites. 
Tels sont par exemple un segment quelconque {a, b] de la droite 
numérique, une boule fermée B {a, rl, ainsi que tout ensemble fini. 


d) Notion d’hyperplan 


L’hyperplan est une généralisation de la notion de plan pour 
l'espace multidimensionnel. On montre en Géométrie analytique 
que toute équation linéaire par rapport aux coordonnées définit un 
plan. Si les coordonnées d'un point courant sont x,, 22, z4, l'équation 
du plan dans l’espace tridimensionnel a la forme: 


Air F Aele + Asla = C. (3-35) 


Si l’on considère le triplet fixe de nombres (a,, a., as) comme 
le vecteur a mené de l'origine des coordonnées au point de coordon- 
nées a,. a& et aget x — (11, Z°. æ3) comme le vecteur définissant la 
position du point courant dans l'espace E., 1e premier membre de 
l'équation (3-35) représentera le produit scalaire des vecteurs a et z 
et l'équation 


ax = c (3-36) 


sera l'équation vectorielle du plan perpendiculaire au vecteur 
a = (ay, ds, as). 

Dans le cas de l’espace multidimensionnel E, l'équation (3-36) 
définira l’hyperplan perpendiculaire au vecteur fixe a = (a, ..…., a) 
et dont les coordonnées courantes se définissent par le vecteur 
z — (x, ..., z,). Désignant l’ensemble des points de l'hyperplan 
par L(zx) et développant le produit scalaire des vecteurs a et 7, 
on aboutit à la définition suivante de l’hyperplan: 


L(x)={rEEn: D ax; —c—0). (3-37) 
i=1 
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Les ensembles 


L'={rEEn: D ari—c>0) (3-38) 
is 
et 
L'={rEE,: > œx—c<0) (3-39) 
1=1 


sont appelés demi-espaces ouverts définis par l’hyperplan L. 


e) Equation d’un segment. 
Moyenne pondérée des éléments d’un ensemble 


Pour obtenir l'équation de la droite passant par les points 2‘! 
et z‘* dans l'espace E,, on prendra sur cette droite un point x de 
façon qu'il divise le segment (z‘}, z'°) en rapport w: 1 — w. Puisque 

le rapport des segments de droite 

r@ reste le même que le rapport de 

w?>l ]eurs projections sur les axes de 
coordonnées, pour les projections 

sur le k-ième axe on obtient la 


relation 
Ty, — Tr uw 
Er, “Tv (8-40) 
Fig. 3-5. Valeurs de w en divers ou 


points de la droite ch = (1—1w) xf +wr, (3-41) 


Posant # = 1, ..., n, on obtient le système d'équations définis- 
sant la droite 
Zi = (1 —10) 29 Lwx : 
doser (3-42) 


Tn = (1—uw) 29 +wif. 


Ce système d'équations peut être écrit de façon plus condensée 
sous forme vectorielle 


z = (1 vw) 29 Huwr®, (3-43) 


L'équation (3-43) est l'équation de la droite passant par les 
points x‘! et x‘, et ceci de la sorte qu'aux différentes valeurs de w 
(fig. 3-5) correspondent les différents points de cette droite. 

En particulier, pour 0 < w << 1 cette équation définit le seg- 
ment compris entre les points x‘? et x'°. 

Il est plus commode d'écrire l'équation d’un segment sous la 
forme 

z= wird ur s wi, Weo>0; wi+u=A. (3-44) 
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La quantité x tirée de (3-44) porte le nom de moyenne pondérée 
des éléments x‘! et zx‘? de poids w, et w,. Cette appellation a une 
signification physique simple. Si l'on place en x‘? et z'° les poidsw, 
et w,, le point x se trouvera au centre de gravité du système. 

La notion de moyenne pondérée peut être étendue à un plus 


grand nombre de points. Etant donné les éléments 2‘, ..., xt”, 
la moyenne pondérée zx est 
m m 
= du, w3>0, Nu, =i. (3-45) 


i—1 i--1 
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a) Définition d’un ensemble convexe 


Soit X un ensemble dans l’espace E,. L'ensemble X est dit con- 
vexe si le segment reliant deux points arbitraires de cet ensemble est 
contenu dans cet ensemble. En d'autres mots, X est un ensemble 
convexe si pour tout z‘l, x'* € X et pour tout w,, w, >> 0, w, + 
+ w, = À on a w,z + w,xr'* € X. 


g 


a) 


Fig. 3-6. Exemples d’ensembles convexes (a) et non convexes (b) 


Les exemples d'ensembles convexes dans l’espace E, — {/zx, y)} 
sont: 2° + y* << 1, 2° + y* L 1; tout le plan E.; les demi-plans 
az + by —c>0 et ax + by — c<O0 (fig. 3-6,a). D'autre part, 
aucun des deux ensembles définis par les équations 1° + y? > 1, 
z° + y* = 1 (fig. 3-6,b) n'est convexe. En effet, le point (0, 0) 
n'appartenant pas à ces ensembles appartient au segment reliant 
les points (1, O0) et (—1,0) des ces ensembles. 

Théorème 3-1. L'intersection d'ensembles convexes est un ensemble 
convere. 

Démonstration. Considérons l'intersection X (| Ÿ d'’en- 
sembles convexes X et Y. Soient x et y deux points quelconques de 
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XNY. Ils appartiennent donc tant à À qu'à Ÿ. Les ensembles X 
ct Ÿ étant convexes, le segment joignant les points x et y appartient 
entièrement à X et à Ÿ, donc à l'intersection X (\Ÿ. Par conséquent, 
XNY est un ensemble convexe. 


b) Enveloppe convexe d’un ensemble fini 


Soit À = {a;,, ..., a, } un ensemble fini de points dans l’espace 
E,. Un ensemble fini n’est pas convexe. Or, les points de l’ensemble 
fini À peuvent être les éléments de quelques ensembles convexes, 
par exemple, de S,, S., etc., comme il 
est montré à la figure 3-7. Dans ce cas 
A est un sous-ensemble des ensembles con- 
vexes 9j, Say 

On entend par enveloppe convexe 
co (4) d'un ensemble À l'intersection de 
tous les ensembles convexes dont À est 
un sous-ensemble. En particulier, si 
ASS, et AG $:, alors co (4A)S= S, f S2. 

Il découle de cette définition que 
Fig. 47. Sur la recherche l'enveloppe convexe co (4) est le plus 
de 1 enveloppe convexe d'un petit ensemble convexe contenant 4. En 

| effet, s’il existait un ensemble convexe 
S tel que AG S et S= co (A), on aurait co (4)Z S f co (4), 
c.-à-d. co (4) S. Il en résulte que S = co (4). 

Théorème 3-2. L'enveloppe convexe d'un ensemble fini À est l'en- 

semble des moyennes pondérées des éléments de À. 


Soient À — {a,, ..., a, } un ensemble fini et w;, i — 1, ..., m 
des nombres réels tels que 
nm 
wi>U; à TES D (3-46) 


1—= 


La quantité 


m 
z= Ÿ wa; (3-47) 

i=1 
s'appelle moyenne pondérée des éléments de 4. L'ensemble S qui 
a pour éléments les quantités x, définies par la formule (3-47) pour 
tout w; dans les limites définies par (3-46), représente l’ensemble des 
moyennes pondérées deséléments de l’ensemble À. Il s’agit de démon- 


trer que 
S — co (4). (3-48) 


Démonstration. Pour que l’ensemble S soit l'enveloppe 
convexe de l’ensemble À, il faut d'abord qu'il soit convexe et, 
ensuite, qu'il soit le plus petit ensemble convexe contenant 4. 
Montrons que ces deux conditions sont vérifiées. 
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1. Prenons deux systèmes arbitraires de poids w; et w; définissant 
deux points de S: 


m m 
ZT =: Ÿ w:;ida;, z' = Ÿ Wii. (3-49) 


Choisissons un point arbitraire x” sur le segment reliant x et x’: 


=({—w)z+uz" = 2 [(— a) wi + uwi] a; — È Wia;j, (3-50) 
i=1 Î 


wi = (1 —w) w; -+uw:. (3-51) 


La quantité w° est non négative, car elle représente la moyenne 
pondérée de deux nombres non négatifs w; et wi. En outre, 


m 5 
2 w=(1—w) À D wi+w Ÿ wi = 1. (3-52) 
= À 


if 


Donc, x” est la moyenne pondérée des éléments de l’ensemble À, 
c.-à-d. que x” E S. Par conséquent, S est un ensemble convexe. 

2. Soit 7 un ensemble convexe quelconque contenant 4. Montrons 
qu'il contient aussi S. 

Par hypothèse, T contient tous les éléments a;. Ensuite, l'élément 


. Ge (3-53) 


sé | 
La = ——— 4 
# utue Titus 


cst la moyenne pondérée de a,, a, € T, de sorte que x, € T7. D'une 
manière analogue ïil vient que 


pp —— NE 2 L3 . 

8 our tus + WF We +3 7 
_ Wa Wrdo w343 
 Wi+ue+ws L y + Us +w3 LL wi + We +w3 (3-54) 


est la moyenne pondérée de x,, «; € T, de sorte que xs; € T. Poursui- 
vons l'examen de cette suite de points; il vient que le point 


2 1 w 977 

Tn = —__— Lin in = w;a:; S v)—.)e) 

me wi+...+um 7 + wit...+uwm 2 ii € (3-99) 
1-- 


appartient aussi à 7. Ainsi donc, tout zx € S appartient aussi à T7, 
c.-à-d. SS T. Or, T est un ensemble convexe arbitraire conte- 
nant À. Il s'ensuit que S est le plus petit ensemble convexe conte- 
nant À. 

Le théorème démontré permet d'établir la forme de l'enveloppe 
convexe d'un ensemble fini. Prenons le cas bidimensionnel. A la 
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figure 3-8 est représenté un ensemble fini À = {a;, @, as, 44, as}; 
on y voit aussi un polygone convexe dont les sommets sont les éle- 
ments de À. Il est facile de voir que tout point situé au sommet, sur 
un côté ou à l'intérieur du polygone convexe peut être représenté 
comme la moyenne pondérée d’au moins trois de ses sommets. Par 
exemple, z, — moy.pond. (a, a2), z = moy.pond. (xs, @3) = 
— moy. pond. (a,, &+, a). Par contre, un point x, extérieur au poly- 
gone ne peut être la moyenne pondérée d'aucun couple de points 
intérieurs, donc ne peut non plus être exprimé comme la moyenne 


Fig. 3-8. Enveloppe convexe Fig. 3-9. Sur la constructivnu 
d’un ensemble fini de l'hyserplan d'appui 


pondérée des sommets du polygone. Ainsi donc, l'enveloppe convexe 
d’un ensemble fini À sur le plan est un polygone convexe dont les 
sommets sont les éléments de À. 

Cette conclusion s'étend sans peine au cas d’un espace arbitraire 
E,. L'enveloppe convexe d’un ensemble fini À dans l’espace E, 
est un polyèdre convexe dont les sommets sont les éléments de À. 
Tout point intérieur ou frontière d'un tel polyèdre peut être représenté 
comme la moyenne pondérée de (n — 1) sommets au maximum. 

En terminant, proposons sans démonstration deux théorèmes qui 
seront utilisés pour argumenter certaines propositions de la program- 
mation linéaire et de la théorie des jeux. 

Théorème 3-2. (théorème de l'hyperplan d'appui). Soient S un 
ensemble con’exe et O un point arbitraire n'appartenint pas à S. Il 
doit exister alors un hyperplan L passant par O de telle façon que S se 
trouve dans un seul des demi-espaces engendrés par L (ce fait est intuiti- 
vement clair pour les cas de l’espace bi et tridimensionnel, voir 
fig. 3-9). 

Commençons à déplacer l'hyperplan dans l'espace en le rappro- 
chant de S jusqu’au moment où L et S acquièrent un point commun 
au minimum, à condition cependant que S soit contenu dans l’un 
des demi-espaces engendrés par l'hyperplan L. Cet hyperplan s'appelle 
hyperplan d'appui de l’ensemble convexe S. 
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Si l’ensemble convexe S est l'enveloppe convexe d’un ensemble 
fini À, il représente un polyèdre convexe. Dans ce cas l'hyperplan 
d'appui passera par le sommet, par l'arète ou par la face du polyèdre 
(fig. 3-10). Dans chacune de ces variantes un sommet au moins du 
polyèdre sera contenu dans l’hyperplan d'appui. 

Théorème 3-4 (théorème de l'hyperplan de séparation). Si S et T 
sont des ensembles convexes sans élément commun et que l’un au moins 


Le 
L£s 
Fig. 410. Droites Fig. 3-11. Hyperplan de 
d'appui d’un ensemble séparation 
convexe 


d'entre eux est borné, il existe un hyperplan tel que les ensembles S 
et T se situent dans des demi-espaces différents engendrés par cet hyper- 
plan. En d'autres mots, il existe un hyperplan px = c, où p — 
— (p;,, .-.., Ph) tst un ensemble ordonné des nombres réels et x — 


= (1,, ..., Z,) un point arbitraire, tel que pr > c quand zE€S 
et pr < c quand x € T. L'illustration géométrique de ce théorème 
est donnée sur la figure 3-11. 


PROBLÈMES AU CHAPITRE 3 


3-1. On donne dans l'espace tridimensionnel trois points z = (1, 0, 2), 
y = (3, 4, 0), z = (1, 2, 3). Vérifier pour ces points l’axiome d'inégalité trian- 
gulaire dans les espaces CS, C£, CS. 

32. Tracer sur le plan (7, y) le cercle de rayon r et de centre a dans les es- 
paces C£, CM, CS. 

33. Démontrer les formules (3-25) et (3-27) de la moyenne. 

34. Décrire le changement qualitatif de la ligne séparant les classes À et B 
de l'exemple 3-5 qui se produit si l’on prend dans À un second échantillon a. 
Examiner les cas a, = (2, 1), a, = (2, 3), a, = (6, 3). 

3-5. De quelle forme sera la ligne séparant les classes À et B sur la figu- 
re 3-4,b si la distance est définie: 

a) d'après la formule (3-3): 

b) d'après la formule (3-4)? 

3-6. Montrer que la boule ouverte B (0, r) dans l’espace E, est un ensemble 
convexe. 

3-7. Soient [0, 3], [5, 7], (0, 3]U({5, 7] des ensembles dans l’espace R 
des nombres réels. Lesquels de ces ensembles sont convexes ? 


3-8. Montrer que le point r, de la figure 3-8 est la moyenne pondérée des 
sommets a;, a, et as. 
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CHAPITRE 4 


ÉLÉMENTS D’ALGÈBRE DE LA LOGIQUE 


4-1. OPÉRATIONS LOGIQUES 


a) Notion de propositions 


On a vu plus haut que la définition d’un ensemble peut étre 
donnée par deux méthodes: par énumération et par description, 
c.-à-d. par indication de la propriété inhérente aux éléments de 
l’ensemble. La méthode descriptive de définition d'’ensembles est 
un pont entre la théorie des ensembles et la théorie des propositions, 
cette dernière représentant le premier chapitre, et aussi le plus élé- 
mentaire, d'une discipline scientifique dite logique mathématique 
[23 à 321. 

On entend par proposition une assertion quelconque qui peut 
être soit vraie, soit fausse. Appliquons le concept de propositions 
aux éléments d’un ensemble universel Z. Les différents éléments 
de cet ensemble ont des propriétés différentes et peuvent donc former 
différents groupes qui sont sous-ensembles de 7. Par exemple, si Z est 
l'ensemble des étudiants du groupe, il peut avoir comme sous-ensem- 
bles : X l’ensemble des étudiants qui ont toutes leurs notes excellentes ; 
Y l’ensemble des étudiants logés au foyer d'étudiants; Z l’ensemble 
des étudiants qui touchent la bourse, et ainsi de suite. 

Une fois que l’on s’est rendu compte des propriétés caractérisant 
les différents sous-ensembles, on peut formuler des assertions déter- 
minées selon lesquelles tel ou tel élément de Z possède ou non la 
propriété en question. De pareilles assertions sont justement des 
propositions. Donnons-en quelques exemples: « il a toutes ses notes 
excellentes », « il loge au foyer », « il touche la bourse ». 

Nous ferons par Ja suite abstracticn de toutes les propriétes des 
propositions sauf une: toute proposition appliquée à l'élément con- 
sidéré de l’ensemble universel Z est soit vraie, soit fausse. C'est 
ainsi que la proposition « l'étudiant Ivanov a toutes ses notes excel- 
lentes » est vraie si Ivanov fait partie du sous-ensemble X et fausse 
dans le cas contraire. 

Aussi dit-on que X est l'ensemble de vérité (ou ensemble des valeurs 
de vérité) de la proposition « il a toutes ses notes excellentes ». Les 
ensembles de vérité des propositions « il loge au foyer » et « il touche 
la bourse » sont respectivement les ensembles Y et 2Z. 

L'ensemble de vérité d’une proposition peut s’avérer être vide. 
On dit alors que la proposition est identiquement fausse. Pour un 
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groupe d'étudiants c’est le cas de la proposition « il a plus de cin- 
quante ans ». Il peut arriver que l’ensemble de vérité d’une proposi- 
tion se confonde avec l’ensemble universel 7 ; c’est une proposition 
identiquement vraie, ou tautologique. Pour un groupe d'étudiants, la 
proposition identiquement vraie est « il a moins de cinquante ans». 


b) Propositions élémentaires et composées 


Désignons les propositions par des lettres minuscules de l’alpha- 
bet latin et associons à chacune d'elles les valeurs numériques 
ou 0 suivant que la proposition est vraie ou fausse. Supposons, par 
exemple, que x désigne la proposition « il a toutes ses notes excellen- 
tes ». Elle a comme valeurs numériques 


4 si x est vrai, c.-à-d. r£€ À; 
ZI = 


O si x est faux, c.-à-d. zé X. (4-1) 

Les propositions x, y, z ayant leurs valeurs de vérité dans des 
ensembles élémentaires X, YŸ, Z sont des propositicns élémentaires. 
Or, il arrive aussi que l’ensemble de vérité Q s'obtient à partir des 
ensembles À, Ÿ, Z au moyen d'une opération algébrique effectuée 
sur ces ensembles. À cet ensemble de vérité Q correspondra alors une 
proposition ccmposée q. Par exemple, à l’ensemble de vérité Q = X NY, 
possédant tant la propriété X (toutes les notes excellentes) que Y 
(loge au foyer), correspond la proposition composée « il a toutes ses 
notes excellentes et loge au foyer ». 

Dans cet exemple nous avons obtenu une proposition composée en 
mettant entre deux propositions la conjonction « et ». On peut aussi 
former des propositions composées en employant d'autres jonctions: 
« ou », « si … alors », etc. On obtient une nouvelle proposition en 
prenant l'inverse de la proposition initiale. À chacune de ces nouvel- 
les prop:sitions correspondront leurs propres ensembles de vérité 
sur l’ensemble universel 7 ; donc, les propositions composées peuvent 
aussi être vraies ou fausses, c.-à-d. admettre les valeurs numériques 1 
et 0. 

Considérant les propositions comme des variables susceptibles 
de valeurs 1 et O0, on arrive à définir les opérations qui, effectuées 
sur ces propositions, font naître des propositions nouvelles. Ces 
opérations exprimeront justement les liaisons employées dans le 
langage courant, dont on a parlé plus haut. 

Les opérations effectuées sur les propositions sont appelées opéra- 
tions logiques. L'ensemble des opérations logiques étudiées dars le 
texte qui suit porte le nom d’algèbre des propositions ou d’algèbre de 
Boole. 


7 
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c) Représentation des opérations logiques 


Soient quelques propositions élémentaires zx;, ..., zA dont 
chacune peut être vraie ou fausse, donc prendre des valeurs numéri- 
ques 1 et 0. La totalité de ces propositions peut être considérée comme 
un cortège (Zi, - -., Zi). 

Supposons qu’à la suite d’une opération logique effectuée sur 
ces propositions on a obtenu une nouvelle proposition g qui peut 
être vraie ou fausse elle aussi, donc peut prendre les valeurs 1 et 0. 
A toute combinaison de valeurs z,, . .., zN correspondra alors une 
valeur déterminée de q € {1, 0}, ce qui permet de considérer une 
opération logique comme une application f 
de l’ensemble des valeurs .du cortège 
(z,, .-.-., zx) sur l'ensemble des valeurs 
de q 


f: (tu ...,zv)—{1, 0}. 


Fig. 4-1. Représentation Si cette application est univoque, elle 
conventionnelle d’une définit la fonction 


opération logique g=f(t, -.. tn) (4-2) 


dite fonction booléenne. Il découle de ce qui précède que les arguments 
des fonctions booléennes, aussi bien que les fonctions elles-mêmes, 
ne peuvent prendre que deux valeurs différentes, à savoir 1 et 0. 

On emploie mois méthodes de représentation des fonctions boo- 
léennes : 

1. Une formule indiquant explicitement la suite des opérations 
logiques effectuées sur Les propositions x,, . .., zx, et ayant la forme 
de la relation (4-2). 

2. Un tableau donnant les valeurs de vérité de la proposition 
composée q en fonction des valeurs de vérité des propositions initia- 
les. Dans la partie gauche du tableau sont énumérées toutes les com- 


Tableau 4-1 

Fonctions de deux variables logiques 

| 

ES > D # = > » 4 
slti@elit"t î sIrIBlit t 
XV| oO h ES # # # > _— 1x 12 LE 2 A # à 
00101010101010 Â { { E 1 1 1 1 0 | O 
011010!1 0 4 1 1 0 1 1 0 1 01010 1 
1010110110 | | (Ù 1 Î 0 1 1 0 | O 1 0 
11410111|1 { 1 ( | 1 | 010!010 1 0 | O 
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binaisons possibles des valeurs de vérité des propositions initia- 
les z;,, ..., xx, et dans la partie droite figurent les valeurs de 
vérité de la proposition composée gq. Si l’on a W propositions initia- 
les, le nombre de lignes du tableau Tableau 4-2 

est 2N. On donne deux exemple de _ 7 


tableaux de cette espice (tableaux q=xy + 
4-1 et 4-2). 
3. Un circuit logique, qui est une F 1 
représentation graphique convention- 
nelle de l'opération logique (voir 0 0 0 0 
fig. 4-1). 1 O0 0 0 
En automatique et en technique 0 1 0 1 
de calculs, on a l'habitude de repré- 0 O0 1 L 
senter les propositions sous la forme 1 1 0 0 
de signaux à deux niveaux ou de 1 O0 1 1 
dispositifs bistables (relais, basculeur, 0 1 1 
tube électronique, transistor, etc.). On 1 1 1 


associe à ces deux niveaux de signaux 

ou deux étais stables du dispositif 

les valeurs numériques 1 et O définissant les valeurs de vérité des 
propositions correspondantes. Le circuit logique représente alors 
un convertisseur de signaux qui peut 
être utilisé pour Ja commande de divers 
processus. 


Exemple 4-1. Dans un thermostat, la tem- 
pérature © est maintenue à un niveau désiré 
6o au moyen d’un élément chauffant EC 
(fig. 4-2) qui a deux régimes de fonctionnement : 
« marche» et «arrêt». La commande de la 
mise en marche de l'élément chauffant s'eflec- 
tuc suivant la règle: 

mettre en marche EC si 68 < 6, ; 

arrêter EC si 6 > 6,. 
| Considérons la proposition ela tempeé- 
Fig. 4-2. Régulation de la  rature dépasse 6,» comme proposition ini- 
température dans un ther-  tiale x et la proposition « mettre en marche 

mostat EC» comme proposition composée g. La 
structure logique du circuit de commande 
ce l'élément chauffant se présente alors comme suit: 


= 4 si z=0; 
0 si z—=1. 


On voit sur la figure 4-2 une réalisation pnysique de cette loi de commande. 
Le signal x s'exprime par la longueur de la colonne de mercure d’un thermo- 
mètre 7 qui, pour 6 > 6,, ferme le contact d’un relais Ret, par là même, met 
en marche l’élément chauffant. 
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f-2. ALGEBRE DES PROPOSITIONS 
a) Négation 

Soit x une proposition à valeurs de vérité dans X. On désigne 
par x (et lit « non zx ») une nouvelle proposition ayant ses valeurs de 

vérité dans l’ensemble X et appelée négation ou inversion de X. 
La relation entre xet x se définit au moyen 
| du diagramme d’Euler-Venn donné sur la figu- 
| p re 4-3,a. Par définition de la négation, on 
a x — 1 dans le domaine X où x = 0, et x—0 
dans le domaine X où z — 1. Cette relation 


s'écrit sous la forme des règles d’inversion 
suivantes : 


1=0, 0—1. (4-3) 
On voit sur la figure 4-3,b la représenta- 
b) tion de l'opération de négation sous la forme 


d’un circuit logique appelé inverseur. 
Fig. 4-3. Diagramme 
d'Euler-Venn et re- 


présentation conven- TE É 
tionnelle de l'opéra. b) Addition logique 
tion d'inversion Soient x et y deux propositions ayant leurs 


valeurs de vérité dans les ensembles X et Y 
respectivement. On désigne par x + y (on écrit parfois x \/ y et 
on lit «x ou y») une nouvelle proposition qui a ses valeurs de 
vérité dans l’ensemble X UY et porte le nom de somme logique 
ou disjonction de zx et y. 


T T+7 T! Lo Ert.+T 
Tr 
y Te 
b) ©) 


Fig. 4-4. Diagramme d’Euler-Venn ct représentation conventionnelle de l’opé- 
ration d’addition logique 


Les relations entre les valeurs numériques de x, y et x + y s’obtien- 


nent du diagramme d'’'Euler-Venn de la figure 4-4,a. L'ensemble de 
vérité de la proposition x + y est le domaine hachuré dans lequel 


O0 si r=0 et y—=0; 
ru (4-4) 


4 dans les autres cas. 
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Il est commode d'écrire les relations (4-4) sous la forme de règles 
qui rappellent un peu les règles canoniques d'’addition arithmétique: 


O+0—=0; ins | 


Le circuit logique utilisé pour représenter l'opération d'’addition 
logique et appelé circuit de réunion est donné sur la figure 4-4,b. 

La règle d’addition logique s'étend sans difficulté au cas de trois 
propositions et plus. Dans le cas général, on définit la somme logique 
de nr propositions par la règle 


(4-5) 


O si xi=m=...—=2, —0; 


mtmt... trs] (4-6) 


4 dans les autres cas. 


On voit le circuit logique pour ce cas sur la figure 4-4,c. 


c) Multiplication logique 


Soient z et y deux propositions à valeurs de vérité dans deux 
ensembles X et Ÿ respectivement. On désigne par zy (on écrit par- 
fois x À\ y et on lit «x et y») une nouvelle proposition qui a ses 


Fig. 4.5. Dia rramme d'Euler-Venn et représentation conventionnelle de l’opé- 
ration d2 multiplication lozique 


valeurs de vérité dans l’ensemble Xf\Y et qui s'appelle produit 
logique ou conjonction de zx et y. 

L'ensemble de vérité de la proposition xzy est représenté sur le 
diagramme d'Euler-Venn (fig. 4-5,a) par le domaine hachuré dans 
lequel 

2 À 0 anse ls ar © 2.7 
4 O0 dans les autres cas. (4-9) 


Cette relation peut être représentée sous la forme des règles de 
multiplication logique qui coïncident avec les règles de multiplica- 
tion arithmétique: 


0.0 = 0, 0.1 = 0, 1-0 = 0,1-1 = 1. (4-8) 
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On voit sur la figure 4-5,b le circuit logique employé pour repré- 
senter l'opération de multiplication logique et qui s'appelle circuit 
d’intersection cu de coincidence. 

La règle de multiplication logique s'étend facilement au cas de 
trois propositions et plus. Le produit logique de nr propositions se 
définit par la règle 

1 si Ti=to=... =LIn—=1Â; Li 
Fire PR 0 dans les autres cas. (4-9) 

Le circuit logique traduisant ce cas est donné sur la figure 4-5,c. 

Une des variantes du circuit de multiplication logique est l’opé- 
ration du produit logique d’une proposition x par l'inversion de 


l’autre y, qui s'écrit 


— En ! — £ Si y =0; 
? ’ 
TU = . 4-10 
ÿ O0 si y—=1. À 
Fig. 4-6. Circuit Cette opération étant assez fréquente, on 
d’inhibition lui réserve une représentation spéciale sous 


la forme du circuit logique de la figure 4-6. Il 
est analogue au circuit de coïncidence, à la différence près que 
l'entrée d’inversion y ne se termine pas par une pointe mais par un 
rond. Comme on peut le voir de (4-10), l’amenée du signal y = 1 
à cette entrée interdit le passage du signal x à la sortie du circuit; 
aussi l’entrée y porte-t-elle le nom d'entrée inhibitive, tandis que le 
circuit de la figure 4-6 est appelé circuit d’inhibition. L'opération 
logique elle-même correspondant aux relations (4-10) s'appelle opéra- 
tion d'inhibition. 


d) Fonctions booléennes 


Les propositions isolées auxquelles on a assigne les valeurs de 
vérité 1 et O0 peuvent être considérées comme des variables binaires; 
on les appellera par la suite variables logiques. Les opérations de 
négation, d'addition logique et de multiplication logique sont des 
fonctions des variables logiques; l'opération de négation est fonc- 
tion d'une variable logique, et les opérations d’addition logique et 
de multiplication logique sont fonctions de deux variables logiques 
et plus. 

La particularité de ces fonctions, comme on l’a déjà signalé, con- 
siste dans le fait qu'elles ne peuvent prendre que deux valeurs 0 et 1. 

Les fonctions n’admettant que deux valeurs différentes tant pour 
l'argument que pour la fonction elle-même portent le nom de fonc- 
tions booléennes. 11 est évident qu'il y a aussi d’autres fonctions boo- 
léennes, en plus de celles mentionnées. Cependant on peut montrer 
que le nombre des différentes fonctions booléennes d'un nombre 
fini de variables logiques est fini. 
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En effet, supposons qu’on désire former toutes les fonctions boo- 
léennes possibles de m variables logiques zx, y, z, . . . La totalité des 
valeurs numériques de ces variables s'appelle collection. On peut 
obtenir au total 27 collections. 

Soit f (x, y, z, . . .) une fonction booléenne. À chacune des col- 
lections correspond une valeur numérique déterminée (1 ou 0) de 
la fonction bocléenne, de sorte qu'on peut considérer la fonction 
booléenne comme une collection de 2" variables. Les différentes 
fonctions booléennes différeront par les valeurs des variables logiques 
de la collection. Chaque variable n’admettant que deux valeurs, 
le nombre des différentes fonctions booléennes de m arguments est 


B(m)= 2". (4-11) 


Quand m = 1, on peut obtenir 2° — 4 diverses fonctions boo- 
léennes, à savoir : les constantes 1 et 0, la fonction zx elle-même et son 
inversion x. 

Pour m = 2, on compte 2* — 16 diverses fonctions booléennes. 
Le tableau 4-1 réunit les valeurs de ces fonctions et leurs désignations 
conventionnelles disposées de telle façon que la seconde moitié du 
tableau s'obtient de la première par l'opération de négation. En plus 
des opérations étudiées plus haut, le tableau 4-1 comporte les fonc- 
tions suivantes: 

z © y, addition modulo deux; 

Z y, y —+ zx, implication, ou conséquence logique; 

zy = x/y, fonction de Sheffer 

x + y, fonction de Pierce (fonction de Webb); 

zTDy=xz- y, équivalence logique; 

z —æy, y —zx, fonction d'inhibition. 

I1 importe de souligner que toutes les fonctions booléennes con- 
sidérées de deux variables logiques peuvent être établies à l’aide 
de trois opérations logiques étudiées plus haut, à savoir: négation, 
multiplication logique et addition logique. Ainsi, on s'assure sans 
peine, par vérification directe dans toutes les collections (x, y), 
que les relations suivantes ont lieu: 


(a) zDy=zy+yr; 
(b)ry=r+y; 
(c) y—z=z+y: | 449) 
(d) rzPy=r-y=1y try; 

(e) z—y=ry; 


— 
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On dit d’une collection d’opérations logiques qu’elle est complète 
si elle permet de représenter n'importe quelle fonction booléenne. 
En plus de la collection examinée ci-dessus, composée d'opérations 
de négation, de multiplication logique et d'addition logique, il 
peut y avoir aussi d’autres collections complètes. Entre autres, la 
collection complète peut être constituée par une seule opération : 


fonction de Sheffer zy, désignée souvent zx/y:; on s'en rend compte 
bien facilement en représentant sous la forme de cette opération les 
trois opérations mentionnées plus haut de la collection complète 


T—1z=1/T; 
Ty = zy = T/y = (z/y)/(x.'y) 9 
z+y— Ty — r/y = (xz/x)/(y/y). 


Il est facile de voir que la fonction de Pierce représente, elle 
aussi, une collection complete. 


e) Lois et identités de l’algèbre des propositions 


Les expressions construites à partir d'un nombre fini de variables 
logiques zx, y, z, . . ., de signes d'opérations logiques de négation, de 
multiplication logique et d’addition logique, ainsi que des constan- 
tes 1 et O, portent le nom de formules booléennes et s’écrivent 
À (z,y z,...),B (x, y,2, . . .), .… Pour que les formules booléennes 
soient comprises sans ambiguïité, il faut mettre chaque nouvelle 
opération logique entre parenthèses. Or, afin d'éviter des formules 
trop encombrantes et de minimiser l'emploi des parenthèses, on 
introduit, par analogie avec l'algèbre élémentaire, un ordre de domi- 
nance des opérations: on effectue en premier lieu les opérations de 
négation, puis celles de multiplication logique et enfin, en dernier 
lieu, celles d'addition logique. 

Chaque formule booléenne peut être considérée comme la repré- 
sentation d’une certaine fonction booléenne des variables zx, y, z,..., 
dont la valeur sur la collection concrète de variables s'obtient sans 
peine en substituant les valeurs des variables qu'elles prennent sur 
la collection donnée (0 ou 1) dans la formule booléenne et en effec- 
tuant les opérations logiques prescrites. 

Pour les mêmes variables logiques, il est possible d'obtenir des 
formules logiques différentes, parmi lesquelles on rencontre parfois, 
par exemple, des formules comme À et B qui fournissent 1 s mêmes 
valeurs des fonctions booléennes sur toutes les collections identiques 
de variables logiques x, y, z, ..., c.-à-d. satisfont à la condition 


A(x,y,2z,...)—B(z, y, 7, ...). (4-13) 
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Un des problèmes de l'algèbre de Boole consiste précisément 
à établir des identités de la forme (4-13). 

Pour vérifier les identités de l'algèbre de Boole, il suffit de cal- 
culer les valeurs des fonctions dans le premier et le second membre 
de l'identité sur toutes les 2" collections de variables. 

Une autre méthode de vérification de l'identité de deux formules 
booléennes consiste à définir leurs ensembles de vérité. Si les ensem- 
bles de vérité pour deux formules booléennes coïncident, ces formules 
donnent une seule et même fonction booléenne. 

On a démontré au chapitre 1 quelques identités de l'algèbre des 
ensembles. Chacune de ces identités définit une certaine identité 
pour les formules booléennes. Considérons par exemple l'identité 
suivante de l’algébre des ensembles: 


(XNY)UZ = (XUZ)N(U2). 
Le premier membre de cette identité est l’ensemble de vérité 
pour la fonction booléenne zy + z, et son second membre l’est pour 
{z + z) (y + z). Puisque les ensembles de vérité coïncident pour 


les deux formules booléennes, ces dernières définissent une seule et 
même fonction booléenne, de sorte que 


ty +2 = (x +2) (y + 2). 
Cette identité est remarquable par le fait qu'elle n’a pas son 
analogue en algèbre classique, ce qui a été signalé au chapitre 1. 
Le lecteur est invité à s'assurer lui-même de l’exactitude des lois 
et identités suivantes de la logique mathématique en les comparant 
aux identités correspondantes de l'algèbre des ensembles ou bien 
en vérifiant les valeurs de vérité dans les premiers et les seconds 
membres sur toutes les collections de variables logiques. 
Lois de l'algèbre de Boole 
a) 2Hy=y+z; 
b) zy:-yzx; 
€) (r-+y)+z=x+(y+2); 
d) (xy)z= x (y2); 
0) (T+y)z—=zz+ y; 
Î) zy+z=(x+2) (+2). 
Identités de l'algebre de Bovlie 


| loi commutative ; 
| loi associative ; 


| loi distributive. 


a) zx =0; g) zx =7z; 
b) z+z—1; h) TH+Tz=ZT; 
c) z-1=7; i) x =zx; 
d) z+1=1; j) z+y=2y; 
€) z-0—0: k) zy—=r+y. 
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4-3. SYNTHÈSE DES RÉSEAUX COMBINATIONNELS 


a) Notion de réseau combinationnel 


On entend par réseau combinationnel un dispositif technique ser- 
vant à transformer l'information discrète et ayant nr entrées et m 
sorties. Les signaux fournis aux entrées et prélevés sur les sorties 
ne peuvent prendre que les valeurs 1 et 0. Ces signaux peuvent être 
représentés par exemple par un niveau haut et un niveau bas de 
tension. De cette façon, le réseau combinationnel transforme un mot 
d’entrée à n lettres de l'alphabet binaire en un mot de sortie à m let- 

tres du même alphabet. On admet que le 


x zy mot de sortie est prélevé à la sortie au 
De même instant que le mot d'entrée arrive 
Z à l'entrée, c.-à-d. que le réseau combina- 
tionnel ne comporte pas de retard de si- 

Fig. 4-7. Exemple d’un  8NAUX.  . 
réseau combinationnel lo- Le réseau combinationnel se construit 
gique souvent à partir de circuits logiques élémen- 


taires de négation, de multiplication logique 
et d'addition logique en reliant en série les sorties d’un circuit logique 
élémentaire aux entrées d’un autre circuit logique, sans jamais 
brancher plusieurs sorties sur une seule entrée. Dans le cas où le 
réseau combinationnel possède un ensemble fini de signaux d'entrée 
TZ, Y, 7, . . . et une seule sortie g, le processus décrit de la mise en 
série des circuits logiques élémentaires correspond au processus 
d'établissement de la formule logique f (x, y, z, . . .) à l’aide des 
opérations réalisées par les circuits logiques élémentaires utilisés. 
Ainsi, à la formule logique de la forme 


correspondra Île réseau combinationnel représenté sur la figure 4-7 
et dans le tableau 4-2. Dans bien des cas, il est commode d' assembler 
le réseau combinationnel avec des éléments réalisant la fonction de 
Sheffer ou celle de Pierce. 

Un des modes de réalisation physique des réseaux combination- 
nels est la construction de montages à relais et à contacts permettant 
d'effectuer les opérations logiques par fermeture et ouverture des 
contacts dans des circuits différents. Désignons par 1 un circuit fermé. 
et par O, un circuit ouvert. Pour pouvoir commander l'état du circuit, 
introduisons des contacts de façon que leur état soit dicté par la 
valeur des variables d'entrée x, y, z, . .. Il est facile de s'assurer 
qu'aux opérations de multiplication logique et d’addition logique 
correspondront alors les couplages des contacts en série et en paral- 
lèle, comme il est montré sur la figure 4-8. 
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En procédant par différents couplages des contacts, on arrive 

à former des montages réalisant des opérations logiques très variées. 
On voit sur la figure 4-9 Île 

gp Circuit fermé! montage à relais et à contacts 
réalisant la formule (4-14), et 
z sur la figure 4-10, les montages 
D—0 —2 Contact a relais et à contacts illustrant 
certaines identités de la logique 


Fe] o Circuit ouvert 0 


20" 0 To Couplage en série xy 


O——0 
L'ouplage 
en ar altète Z+y Z 


Fig. 4-8. Représentation des opé- Fig. 4-9. Circuit de commutation 
rations logiques élémentaires au pour l'opération zy + z 
moyen des contacts 


mathématique. Au cours de ces dernières années, on réalise de 
plus en plus souvent les réseaux combinationnels sans contacts 


ù £ / T+{=1] 
d 


Ty+2z=(T+z)(y +2) 


4 Zz Z \ 
\ 
zT y | T y 
Fig. 4-10. Transformations identiques des circuits de commutation 


au moyen d'éléments magnétiques et semi-conducteurs réunis en 
circuits intégrés. 


b) Etablissement de la formule logique 
correspondant à une table donnée 


Lors de la mise au point des réseaux combinationnels, on arrive 
bien rarement à exprimer les problèmes destinés à être résolus par 
ce réseau directement sous la forme d’une formule logique ; générale- 
ment, à la première étape, en utilisant la description verbale des 
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problèmes, on dresse un tableau établissant la relation entre les 
valeurs numériques des variables logiques d'entrée et de sortie. Le 
passage du tableau à la formule logique constitue la seconde étape 
de la synthèse des réseaux combinationnels. 

Un tableau est dit élémentaire s'il correspond au cas de la multi- 
plication logique ou de l'addition logique des propositions initiales. 
Si le tableau correspond à l'opération de multiplication logique, on 
verra des zéros dans toutes les lignes de la colonne gq, sauf dans une 
seule ligne, qui correspond aux propositions initiales vraies: dans 
cette ligne on verra 1. Si le tableau correspond à l'opération d’addi- 
tion logique, on verra des unités dans toutes les lignes de la colonne q 
sauf dans la seule ligne, correspondant aux propositions initiales 
fausses, où il y aura zéro. 

Explicitons le mode d'obtention de la formule logique pour un 
tableau élémentaire sur les exemples des tableaux 4-3 et 4-4. 

Dans le tableau 4-3, le zéro ne figure que dans la deuxième ligne 
de la colonne q, ce qui correspond à l'opération d’addition logique. 


Puisque dans cette ligne z = 0 et y = 0, on a q — z + y. 


Tableau 4-3 Tableau 4-1 
q=2+y 4=zY 
xu q xy q 
0 0 | 0 (4) 
1 O0 () { 0 fl 
O 1 O !{ ü 
14 1! | ! (4) 


Dans le tableau 4-4 l’unité ne figure que dans la deuxième ligne 
de la colonne q, ce qui correspond à l'opération de multiplication 
logique. Puisque dans cette ligne x — 1 et y — 1, on a q = xy. 

Si le tableau n'est pas élémentaire, on établit la formule logique 
correspondante par un des deux procédés standard suivants. 

Premier procédé. Dans la colonne q, il faut remplacer successive- 
ment toutes les unités sauf une par des zéros, puis établir les formu- 
les logiques pour chacun des tableaux élémentaires ainsi formés 
et prendre leur somme logique. 

Deuxième procédé. Dans la colonne q, il faut remplacer successive- 
ment tous les zéros sauf un par des unités, puis établir les formules 
logiques pour chacun des tableaux élémentaires ainsi formés et 
prendre leur produit logique. 

Illustrons ces procédés sur l'exemple d'obtention de la formule 
logique pour le tableau 4-5. D'après le premier procédé, considérons 
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indépendamment les tableaux où l'unité ne figure que dans la deuxiè- 
me et la troisième ligne de la colonne gq. Les formules logiques 
correspondantes sont respectivement xzy et zy. Prenant leur somme 
logique, on a: | 


q = 2y + y. 
D'après le deuxième procédé, considérons séparément les tableaux 


contenant les zéros seulement dans la première et la dernière ligne 
de la colonne q. Les formules logiques qui 


correspondent à ces tableaux sont respec- Tableau 4-5 
tivement æ+y et x +y. Prenons le Addition modulo deux 
produit logique de ces deux formules : 

il vient : XL q 


g=(x+y) (x +y). 


On voit que Je premier et le 
deuxième procédé fournissent des formules 
booléennes différentes pour un seul et 
même tableau. Or, utilisant les iden- 
tités de la logique mathématique, on 
arrive Sans peine à ramener la deuxié- 
me formule à la première. Ouvrant les parenthèses et se rappelant 


que zz=— Oet yy — 0, on obtient: 


— 
= © © 
OR — 


Q= ZE + Ty + YT + Yy = Ty + Ur. 


La méthode proposée est universelle, car elle permet d'obtenir 
la formule logique et de construire ensuite le réseau combinationnel 
pour n’importe quel tableau. Cependant cette méthode fournit le 
plus souvent des formules très encombrantes, complexes, qui ne sont 
réalisables que moyennant une grande quantité de divers éléments. 
La complexité de la formule traduit le nombre d'opérations qu’elle 


recèle, de sorte que la complexité de la formule z est le nombre 1, 
et celle de la formule (x + y) (y + z), le nombre 9 (deux négations. 
deux additions, une multiplication). En qualité d'exemple, établis- 
sons la formule logique d’après le premier procédé pour le tableau 4-2: 


q = 2y2 + Tys + aus ++ Tys + zys. (4-15) 


Cette formule est beaucoup plus complexe que (4-14) bien qu'elles 
correspondent au même tableau. On voit donc que, pour la synthèse 
des réseaux combinationnels, il est très important de simplifier ou 
de minimiser les formules booléennes. 
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c) Simplification des formules booléennes 


Pour simplifier les formules booléennes, on utilise les identités 
de la logique mathématique étudiées dans le paragraphe précédent. 
IT est vrai que leur emploi efficace exige de l'habitude et de l’art 
dans leur manipulation, qui ne s’acquièrent qu'après une certaine 
expérience de pareilles transformations. Or, il existe quelques pro- 
cédés standard qui permettent de mener à bien, dans la plupart des 
cas. la simplification d’une formule compliquée [24, 30]. 

La simplification d'une formule booléenne commence par la 
recherche de l'une des formes suivantes: AB + AB, À + AB, 
A + AB, où À et B symbolisent soit les variables logiques elles- 


mêmes, soit les produits logiques de plusieurs variables. Chacune 
des expressions obtenues peut être écrite sous une forme plus simple: 


AB+AB=A(B+B)=A; (4-16) 
A+ AB = A(1+ B)= 4; (4-17) 
A + AB = (A+ AB) + AB = A + B. (4-18) 


Reprenons la formule (4-15) et essayons de la simplifier par appli- 
cation des identités étudiées. Groupant le premier et le quatrième 
terme, puis le troisième et le cinquième et appliquant l'identité 
(4-16), on obtient: 


q = zy + Tyz + Zz. 
La simplification se poursuit sans difficulté: 
qg=2(y+yz)+az=r(y+2) Has zy+ ist x = xy +2. 


En simplifiant les formules logiques, il ne faut pas oublier 
l'identité À + À = À, d'où il s'ensuit que chacun des termes peut 
être utilisé plusieurs fois dans les combinaisons avec d’autres termes. 
Compte tenu de ce fait, simplifions la formule suivante: 


q = zyz+ TYZ + TYz + Zyz. 


Appliquant l'identité (4-16) aux deuxième et quatrième termes, 
ainsi qu'aux troisième et quatrième, on obtient: 


q=2yz + 2y Lys = x (y + yz)-+yz= x (y +2) + yz = xy +22 + y. 


Les identités susmentionnées ne permettent pas de pousser la 
simplification plus loin. La question se pose de savoir si la forme don- 
née est élémentaire. Pour le vérifier, voyons si elle ne comporte pas 
de termes superflus. On dit que le terme est superflu si dans chaque 
collection de variables où ce terme devient l'unité il y a encore un 
croupe d’autres termes qui devient l’unité de même. C'est ainsi que 
le terme zy devient l'unité dans la collection z = 1, y — 1. La somme 
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de deux autres termes donne xz + yz = z + z — Â. Ainsi donc, le 
terme xy est superflu et peut être éliminé de la formule, ce qui 
donne en définitive 


qg—212+ yz. 


De toutes les formes ne contenant aucun terme superflu, en les 
examinant toutes une à une, on recherche la forme élémentaire. Il 
peut y avoir plusieurs formes de cette espèce. 

Pour les cas où le nombre de variables d'entrée n’est pas supé- 
rieur à quatre, il est commode de rechercher les formes élémentaires 
des formules booléennes en employant des tableaux spéciaux dits 
cartes de Karnaugh ou diagrammes de Veitch. Le tableau 4-6 repré- 


Tableau 46 Tableau 4-7 
Carte de Karnaugh pour Carte de Karnaugh pour la 
la fonction booléenne de fonction booléenne définie 
trois variables par le tableau 4-2 
xv XV 
0 0 1 
0 O0 | 2 0 O0 X 
0 1 3 4 — 
0 1 
11 | à 6 [xt x 
4 0 7 8 1 1 X 
4 0© X 


sente la carte de Karnaugh pour la fonction booléenne de trois varia- 
bles. Chacune des cases de cette carte (numérotées pour faciliter l’ex 
posé) correspond à une collection de variables x, y, z. Les cases cor- 
respondant aux collections dans lesquelles la fonction booléenne 
admet la valeur 1 sont marquées par des croix, comme il est montré 
sur le tableau 4-7 représentant la carte de Karnaugh pour la fonction 
booléenne définie par le tableau 4-2. La carte est construite de telle 
façon que les zones correspondant aux divers groupes de cases voisines 
peuvent être considérées comme les ensembles de vérité pour les 
propositions correspondant aux formules booléennes élémentaires 
à une et à deux variables (les bords supérieur et inférieur de la carte 
sont considérés comme étant collés ensemble, de sorte que les cases 
les plus hautes et les plus basses sont voisines). De cette façon, aux 
zones formées par quatre cases voisines correspondent les formules 


booléennes d'une variable: 1234 — x; 5678 — x; 3456 — y: 
1278 — y: 1357 — z: 2468 — z. 


8—0732 
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Aux zones de deux cases voisines correspondent les fonctions 


booléennes de deux variables de la forme: 12 — zy; 96 — xy; 
68 — rz, et ainsi de suite. 

Pour rechercher la formule booléenne déterminée par une confi- 
guration quelconque de cases de la carte de Karnaugb, il suffit de 
représenter cette combinaison sous la forme de réunion des zones 
indiquées plus haut. La plus élémentaire des représentations de cette 
espèce traduit justement la formule booléenne la plus simple. Par 
exemple, dans le cas du tableau 4-7, la zone marquée peut être repré- 
sentée comme la réunion de la bande verticale 2468, ou z, avec la 
bande horizontale 34, ou xy, d’où il vient q = z + xy. 

Lorsqu'il s’agit de simplifier les formules booléennes à un grand 
nombre de variables, l'emploi des méthodes proposées devient 
pénible. Dans ces cas il est rationnel d'employer des méthodes spé- 
ciales de minimisation, parmi lesquelles on conseille tout spéciale- 
ment la méthode de Quine-McCluskey [31]. 


d) Exemples de synthèse des réseaux combinationnels 


Exemple 4-2. Construire le circuit logique de l’additionneur à une position 
à deux entrées (semi-additionneur). 

L'additionneur à une position effectue l'addition de deux nombres à un 
chiffre d’après la règle 


0+0=0,0+1=1+0=1,1+1= 10. 


Dans le dernier cas on laisse O0 à la position donnée, et l'unité est reportée 
à la position suivante. Désignons par z et y les valeurs de la position donnée de 
termes, par q la valeur de la position donnée de la somme et par p l'unité repor- 
tée à la position suivante. Le fonctionnement du semi-additionneur sera résumé 
alors par le tableau 4-8, d'où l’on tire: 


CTYH Ty; P=Ty. (4-19) 
Le circuit logique du scemi-additionneur est donné sur la figure 4-11. 
Tableau 48 Tableau 4-9 
Semi-additionneur Décodeur 
x1 | q P xY | q1 q2 q3 qs 
0 0 0 0 0 0 1 (ÿ) 0 (9) 
Of { 0 0 1 0 1 0 0 
j O 0 1 0 0 0 1 0 
1 1 0 1 1 1 0 0 0 1 


Exemple 4-3. Circuit de sélection (décodeur). Un circuit logique à deux en- 
trees z, y ct à quatre sorties q1, 42, qa, g4 st appelé circuit de sélection si le signal 1 
n'apparait qu’à une seule sortie pour chacune des quatre combinaisons possibles 
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de signaux d'entrée. A ces conditions satisfait le tableau 4-9 dans lequel les 
signaux de sortie du circuit sont 


G=TY; G=TIY; G=2y; GI. (4-20) 


On voit sur la figure 4-12 la structure logique du circuit de sélection. 

Exemple 4-4. Dispatcher automatique. Donnons un cas très simplifié de 
construction d’un dispatcher automatique commandant l'atterrissage des avions 
sur l’aérodrome. Considérons l’aérodrome à piste d'atterrissage unique. L'avion 
qui vient donne ses indicatifs d'appel, et le dispatcher automatique délivre 
l'autorisation d'atterrir. S’il y a plusieurs avions qui viennent en même temps, 
le dispatcher automatique donne à un avion l’autorisation d’atterrir et propose 
aux autres de rester un certain temps dans l'air. 


Z p 
y 
g! g2 gs gs 
g 
TL 
ÿ 


Fig. 4-11. Semi-additionneur Fig. 4-12. Décodeur 


Attribuons à tous les avions de l'aérodrome des numéros de 1 à n. 
Si plusieurs avions se présentent en même temps, la préférence est accordée 
à l'avion de numéro plus petit. On fera abstraction du cas où il y a plus de trois 
avions sollicitant l'autorisation d'atterrissage ; on admet que ce cas est impos- 
sible. 11 s’agit de construire un réseau combinationnel remplissant les fonctions 
de dispatcher automatique. 

Donnons la formulation du problème en termes de logique mathématique. 
Désignons par r4 le signal d'arrivée du k-ième avion. Le réseau combinationneL 
logique doit délivrer au k-ième avion un des trois signaux suivants: 


g}, atterrir immédiatement ; 
9, faire un tour au-dessus de l'aérodrome; 
gr, faire deux tours au-dessus de l'aérodrome. 


Il est difficile de décrire le fonctionnement du réseau par un tableau ; procé- 
dons donc autrement. Remarquons que les signaux q?, g; et gx ne peuvent prendre 


la valeur unité que si c'est le k-ième avion qui se présente, donc si rx = 1. Par 
conséquent, le signal z, doit figurer à titre de facteur dans les formules 
logiques de q?, gx et gr, ces dernières ayant donc la forme 


à = Aîty, Qu = Ajth = A; zr. (4-24) 
On obtient les formules logiques de AP, 4; et A; en effectuant le passage: 

de k à k<+ 1. 
La condition Ah, — 1 est vérifiée en l’absence de tout signal de l’ensem- 


ble r,,...,z,, c.-à-d. en l'absence de tout signal de l’ensemble z,, . .., x, _, 
ct en l’absence de signal r,. Ainsi donc, 


A = AÿZh. (4-22) 


La condition Ah+, — 1 est vérifiée en présence d’un signal de l'ensemble 
Tise Th, C.-à-d. en présence d’un signal de l’ensemble r,....,r, et en l’ab- 


8e 
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sence de signal r, ou en l’absence de tout signal de l'ensemble r,, ..., Zk 1 et 
en présence de signal z,. Ainsi donc, 
A4 = À; 2h + AQzn = Ain +. (4-23) 


La condition Ah, — 1 est vérifiée s’il y a deux signaux de l’ensemble 
Zi + Th, C.-à-d. en présence de deux signaux de l’ensemble r,,..., zketen 


0 LA 4 
Ake] Akes 


Fig. 4-13. Dispatcher automatique 


l'absence de z, ou en présence d’un signal de l’ensemble z,, . .., x, et en pré- 
sence de z,. Ainsi donc, 


A = AR TR + Ath = AR TR +98. (4-24) 


Les formules (4-21) à (4-24) décrivent complètement la structure logique 
d’une cellule du réseau combinationnel commandant l'atterrissage du k-ième 
avion; on voit son schéma sur la figure 4-13. Construisant de pareils réseaux 
pour chaque cellule et les groupant, on obtient le schéma complet du dispat- 
cher automatique. 


4-4. NOTION D'AUTOMATES FINIS 


a) Réseau combinationnel 
comme automate fini sans mémoire 


On fait usage du terme « automate fini » pour désigner une classe 
de systèmes dynamiques numériques employés en automatique, télé- 
mécanique et technique de calcul [25, 31]. 

Nous rencontrons les automates finis, sous la forme la plus 
élémentaire, en étudiant les réseaux combinationnels tels qu’on 
vient de les considérer ; il est commode toutefois de leur donner une 
définition quelque peu plus générale. 

Soient plusieurs variables logiques u:, ..., u, telles que leur 
totalité puisse être considérée comme une grandeur à plusieurs 
dimensions u — (u,, ..., u,). Soit ensuite f la fonction logique de 
ces variables constituant une proposition logique composée 


qg = f(us + .., u). (4-25) 
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La variable logique q peut être considérée comme la variable de 
sortie d un réseau combinationnel réalisant l’opération logique f 
sur les variables u,, . .., u,. 

En pratique, les réseaux combinationnels possèdent générale- 
ment, au lieu d’une sortie unique q, plusieurs sorties 1, - : » Qm» 


de sorte que chaque sortie réalise sa propre fonction logique des 
mêmes variables logiques 


Gi fi (ui, -.., Ur); 
Louer. (4-26) 


Im —= fm (us, .. Ur). 


La Structure de ce réseau combinationnel est montrée sur la figu- 
re 4- 

Les relations (4-26) peuvent avoir une forme plus condensée si 
l'on fait intervenir une variable logique de sortie à plusieurs dimen- 
SiONS q = (Qy;, - .- :; Im) et une fonction 
logique à plusieurs dimensions f — 

. + fm). L'ensemble des fonctions 
(4-26) s'écrit alors sous la forme d’une 
fonction multidimensionnelle unique 


g = f (u). (4-27) 


Supposons ensuite que le réseau com- 
binationnel réalise instantanément son 
opération logique, c.-à-d. que, pour une 
certaine valeur u E U de la variable 


0 1 2 an  Ë 
Lo ty L ln 


u,u, 


Fig. 4-14. Automate Fig. 4-15. Echelle du temps discret 
fini sans mémoire 


d'entrée arrivée dans le réseau en un certain instant, on obtient 
à la sortie la valeur correspondante q = f (u) pratiquement au 
méme instant. 

Pour donner la description du fonctionnement du réseau combi- 
nationnel dans le temps, on introduit la notion de femps discret. Sur 
l'axe de temps, marquons les instants, où la variable d'entrée peut. 
subir des modifications, en les désignant par fo, 1, dt, . . . Il est 
commode de désigner les instants notés simplement par des entiers 
non négatifs O, 1, 2, ...; on les appelle unités de temps. On voit 
se former alors une échelle (fig. 4-15) qui porte le nom d'échelle du 
temps discret. 
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Désignons par la lettre 2 l'unité de temps actuelle, c.-à-d. 
correspondant à l'instant de temps actuel. Les valeurs des variables 
d'entrée et de sortie à l'instant actuel seront désignées par u [n] 
et q [nr]. Les valeurs prises par les variables d'entrée et de sortie k 
unités avant l'instant actuel seront désignées par u [n—%k] et 
q{nr—k]. Mettant en équation le fonctionnement du réseau combi- 
nationnel dans le temps, on écrit 


q {nl = f (u [n)). (4-28) 


Les réseaux combinationnels constituent la forme la plus élé- 
mentaire d'automates finis, appelés automates finis sans mémoire. 
Par cette appellation on souligne le fait que la variable de sortie du 
réseau combinationnel à chaque unité de temps dépend uniquement 
des signaux d'entrée à cette même unité de temps et ne dépend ni de 
l’état du réseau, ni des signaux d'entrée pendant les unités de temps 
précédentes. 


b) Automates finis de la forme générale 


Etant la forme la plus élémentaire des automates finis, les auto- 
mates finis sans mémoire ne peuvent servir comme éléments consti- 
tutifs de dispositifs de calcul et de systèmes automatiques que d'une 
façon assez limitée. On élar- 
git avantageusement les pos- 
sibilités des automates finis 
en leur ajoutant des éléments 
complémentaires effectuant le 
retardement des signaux d’en- 
trée d’une unité de temps: ce 
sont les éléments de mémoire. 
On en voit une représenta- 
tion schématique sur la figure 


r(?] F te 


Fig. 4-16. Cellule Fig. 4-17. : Automate fini avec mé- 
de mémoire moire 


4-16. Combinant les éléments de mémoire avec les réseaux combi- 
nationnels, on obtient les automates finis de la forme générale. 

Un automate fini pourvu de mémoire se caractérise par le fait 
que son état ne se définit pas seulement par la nature des signaux 
d'entrée à l'unité de temps donnée mais aussi par l’état dans lequel 
il s'est trouvé à l'unité de temps précédente. On fait généralement 
une distinction entre l’état de l’automate et son signal à la sortie. 


4-4. NOTION D'AUTOMATES FINIS 119 


Le schéma représenté sur la figure 4-17 peut servir d'exemple d'un 
automate fini avec mémoire. Il comprend trois réseaux combination- 
nels réalisant trois fonctions logiques f,, f, et f.; et deux éléments de 
mémoire. Sa particularité consiste en ce que les signaux z, et z., 
recueillis à la sortie de deux réseaux combinationnels, arrivent, avec 
un retard d’une unité de temps, à l'entrée des mêmes réseaux. Ces 
signaux circulant dans le circuit de l’automate fini peuvent être 
appelés variables décrivant l’état de l’automate. Le signal de sortie 
q est une fonction des variables d'état. 

Donnons la description du fonctionnement du montage repré- 
senté à l'unité de temps 7. Pour simplifier l'écriture, omettons d'’in- 
diquer le numéro nr de l'unité de temps. Les valeurs prises par les 
variables d’état à l'unité de temps donnée à l'entrée de la cellule 
de mémoire seront marquées par un apostrophe. Les signaux z', x 
et g ont pour équations 


TZ, = fi (Ti, To, Us, Us); 
TZ, = Î: (Zi: Las Us Le) ; (4-29) 
q=f3 (z;, TZ.) — (Z1, Toy Us: Us). 


Pour abréger l'écriture, faisons intervenir des grandeurs multi- 
dimensionnelles u — (u,, u.), x = (x,, x.) et une fonction multi- 
dimensionnelle f — (f,, f.). Les équations (4-29) prennent alors la 
forme 

r'=f(r u); qg=qpl{x, u) (4-30) 


La fonction f (x, u) définissant le nouvel état intérieur de l’auto- 
mate fini porte le nom de fonction des transitions, et la fonction 
o (x, u) définissant la nouvelle valeur du signal de sortie s'appelle 
fonction des sorties. 

Désignant par U l’ensemble des signaux d'entrée, par Q l’ensem- 
ble des signaux de sortie, par XÀ l’ensemble des états, on arrive à don- 
ner à l’automate fini une définition formelle suivante. 

On entend par automate fini la collection des cinq grandeurs sui- 


vantes : 
À = (U, Q, À, Îe œ), (4-31) 


où f: X x U — X est la fonction des transitions et om: À x U — 
—+Q la fonction des sorties. 

D'habitude, on définit les automates finis non par des équations 
(4-30) mais par deux tableaux, appelés respectivement tableau des 
transitions et tableau des sorties. Les lignes des deux tableaux corres- 
pondent aux différents signaux à l'entrée de l’automate fini, et les 
colonnes, à ses différents états. A l'intersection des lignes et des colon- 
nes. on trouve dans le tableau des transitions les valeurs de la fonc- 
tion f (x, u), et dans le tableau des sorties, celles de la fonction 
o (x, u). Les tableaux 4-10 et 4-11 donnent l'exemple de définition 
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Tableau 4-10 Tableau 4-11 
Tableau des transitions de Tableau des sorties de 
l’automate fini l’automate fini 
Ed Ed 
u u 
| 2 | 3 | 2 | 3 
a 2 3 a c c d 
b 3 2 2 b d c c 


d'un automate fini admettant deux signaux possibles à l'entrée a 
et b, deux signaux possibles à la sortie c et d et susceptible de trois 
états différents 1, 2 et 3. 
Il y a un autre mode de définition d’automates finis, qui est plus 
instructif: c’est la définition au moyen de graphes orientés. Les 
sommets du graphe, représentés au moyen 
bi{c) de petits cercles, désignent les différents 
états de l’automate. Deux sommets x; et 
x, sont reliés par un arc allant de x, vers 
zx, dans le cas où il y a un signal u qui 
fait passer l’automate de l’état x, à l’état 
z,. Chaque arc est marqué par le signal 
u commandant la transition donnée, et 
aussi, le plus souvent. par le signal q 
(entre parenthèses) qu’on obtient à la 
sortie après la transition donnée. Le 
graphe correspondant aux tableaux 4-10 
a(d) et 4-11 est donné à la figure 4-18. 
| | Les automates finis représentent le 
Fig. 4-18; Graphe des Hans modèle mathématique d’une classe très 
FONS COUR AUOT étendue de systèmes dynamiques fonc- 
tionnant en temps discret, parmi lesquels 
se rangent aussi quelques systèmes dynamiques à étapes multiples 
étudiés dans la deuxième partie de cet ouvrage. La théorie des 
automates finis ne saurait être exposée ici en détail: quelques 
exemples, empruntés à [32], nous suffiront. 


Exemple 4-5. Générateur d'unités. On voit à la figure 4-19, a le graphe d’un 
automate fini qui, à chaque unité de temps, délivre le signal 1 sans liaison avec 
le signal à l’entrée, une fois que le signal 1 a été reçu à son entrée. Les fonctions 
des transitions zx’ = f (x, u) et des sorties qg — œ (x, u) de cet automate sont 
données dans le tableau 4-12, d’où il vient: 


z'=q=u—+z. (4-32) 
La structure de cet automate est représentée sur la figure 4-19,b; on y re- 


marque une entrée auxiliaire r grâce à laquelle on fait cesser la génération 
d’unités en y faisant parvenir un signal. 
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Exemple 4-6. Compteur. On voit à la figure 4-20,a le graphe d'un automate 
fini délivrant à la sortie le signal 1 chaque fois qu’un couple d'unités, en 
alternance avec un nombre arbitraire de zéros, a été appliqué à l'entrée. Un tel 
dispositif porte le nom de compteur à base deux. La fonction des transitions et 
la fonction des sorties de cet automate sont données par le tableau 4-13 d'où 
on trouve: 


z'=uxz ur; q=ur. (4-33) 


La structure du compteur à base deux est donnée à la figure 4-20,b. On 
y remarque une entrée auxiliaire r: appliquant un signal à cette entrée, on 


DO FT 1) o(1) D 
d 1 (1) rÈ 
@) ri 


b) 


Fig. 4-19. Graphe des transitions et structure d’un générateur d'unités 


0(0) (0) 0(0) 


(1) 
a) 


Fig. 4-20. Graphe des transitions et structure d’un compteur binaire 


arrête le compteur et on le fait passer à l’état initial 0. La représentation con- 
ventionnelle d’un compteur à base deux est donnée à la figure 4-21,a. A la figu- 
re 4-21,b on voit le schéma de nr compteurs à base deux couplés en série et for- 
mant un compteur à base 2n. 


Tableau 4-12 Tableau 4-13 
Générateur d'unités Compteur binaire 
ux x’ q ux | x” q 

00 0 ( 00 0 0 
14 0 | | 140 | 0 
0 1 1 Â 0 1 | 0 
1 1 | | 4 1 0 | 


Exemple 4-7. Modèle du processus d'apprentissage. À la base d’un compteur 
à base deux. on construit un schéma susceptible de simuler, d’une manière 
très simplifiée il est vrai, le processus de l'apprentissage. Ce schéma est repré- 
senté à la figure 4-22. Le système en question possède deux entrées a et b et 
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apprend que l’arrivée du signal unité à l'entrée a est suivie de l’arrivée du si- 
gnal unité à l'entrée b. Si cela se reproduit 27 fois (pas obligatoirement de suite 
et même, peut-être, avec beaucoup de fautes), le schéma apprend à prévoir 
l’unité à l’entrée b chaque fois que l'unité arrive à l’entrée a, ce qui s'exprime 
par le fait que le schéma délivre l’unité à la sortie g toutes les fois que l'unité 
apparaît à l'entrée a. 


Fig. 4-22. Modèle du processus d’apprentissage 


Le schéma de la figure 4-22 simule un processus de l'apprentissage très 
rudimentaire. Moyennant quelques artifices, on arrive à perfectionner le schéma 
de telle façon que le fait « a suivi de b » ne soit retenu que si cet événement à eu 
lieu 2r fois sans une seule faute, et que ce fait soit ignoré en cas de réalisation 


Fig. 4-23. Modèle perfectionné du processus d'apprentissage 


de l'événement « a n’est pas suivi de b » 2" fois sans interférence de l'événement 
« a suivi de b ». Ce schéma est représenté à la figure 4-23. 


PROBLÈMES AU CHAPITRE 4 


4-1. Quelle opération logique décrit le fonctionnement du circuit de comman- 


de de l'exemple 4-1? 
4-2. Quelle cst la différence entre la formule booléenne et la fonction boo- 


léenne ? 
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4-3. A l’aide des circuits de commutation, vérifier les identités x + x = 1; 
z+1i=1; z0—0; zz =. 

4-4. Etablir le réseau d'éclairage d’un local possédant deux portes aux 
extrémités opposées, permettant de brancher l'éclairage en entrant par une porte 
quelconque et de le débrancher en sortant par une porte quelconque. 

4-5. Simplifier les formules booléennes: 


zyz+zyz + zyX ; 
zy2H2y2—+ 2yz; 
zy+2z+(xy +2) (zv +2). 


4-6. Construire le circuit logique d’un additionneur binaire à une position 
à trois entrées en désignant par z, y les valeurs des positions des nombres à addi- 
tionner ; par z, l’unité reportée de la position précédente de la somme; par p, 
l'unité reportée à la position suivante; par q, la valeur de la position donnée de 

somme. 

4-7. Etablir le circuit logique d’un additionneur binaire à une position 
à trois entrées en utilisant des additionneurs binaires à une position à deux en- 
trées. 

4-8. Utilisant les résultats des problèmes 4-6 et 4-7, construire le circuit 
logique d’un additionneur binaire à positions multiples. 


CHAPITRE 5 


ASPECTS ENSEMBLISTES 
DE LA THÉORIE DES PROBABILITÉS 
ET ÉLÉMENTS DE STATISTIQUE MATHÉMATIQUE 


5-1. NOTION DE PROBABILITÉ 


a) Evénement. Espace des épreuves 


A la base de la théorie des probabilités est mis le concept d’évé- 
nement aléatoire. Nous associons ce concept à la réalisation d’une 
certaine expérience. 

En parlant d’une expérience, on s'attache à apprendre son résul- 
tat ou, comme on dit en théorie des probabilités, le cas ou l'épreuve 
qui se réalise à la suite de cette expérience. Admettons que dans les 
conditions données l'expérience donne lieu à un nombre fini d’épreu- 
VS Zj + + <> 2m: dont la collection complète sera désignée par 


Z' = 25, ..., Zm}: (5-1) 


Il est évident que toute expérience doit obligatoirement donner 
lieu à une certaine épreuve z € Z; d'autre part, aucune expérience 
ne peut avoir pour résultat deux épreuves ou plus. L'ensemble Z 
sera appelé espace des épreuves liées à l'expérience, et ses éléments 
z CE Z, événements élémentaires dans l’espace Z. 

Or, ce ne sont pas les événements élémentaires eux-mêmes qui 
nous préoccupent surtout, mais leurs collections déterminées, qui 
représentent des sous-ensembles de Z. Tout sous-ensemble S de l’en- 
semble Z sera appelé événement dans l’espace des épreuves Z: 


Sa Z. (5-2) 


En disant que l’événement S se produit ou se réalise, on sous- 
entend que l'événement élémentaire z, qui est l’épreuve liée à l’ex- 
périence, est contenu dans S. 

Pour deux événements arbitraires S, et S, appartenant à l’espa- 
ce des épreuves Z, les définitions suivantes sont possibles : 

La réunion S;, (JS, des événements S, et S,: c’est l'événement 
qui consiste dans la réalisation d'au moins un des événements $, 
et 2. 

L'intersection SAS: des événements S, et S,.: c’est l’événe- 
ment qui consiste dans la réalisation de S, et de S.. Les événe- 
ments $, et S, sont dits incompatibles si la réalisation de l’un d'eux 
rend impossible la réalisation de l’autre, c.-à-d. si S,NS: = @. 


5-1. NOTION DE PROBABILITÉ 125 


Le complémentaire S de l'événement S est l'événement consistant 
dans la non-réalisation de S. 

L'événement certain consiste dans la réalisation d’au moins un des 
événements de l’espace Z. 

L'événement impossible est l’ensemble vide @ qui évoque la non- 
réalisation d'aucun des événements de Z. 


Exemple 5-1. On jette deux dés à jouer à faces numérotées de 1 à 6. Considé- 
rons l’ensemble J — {1, 2, ... 6}. L'épreuve qui se réalise à la suite de l’expé- 
rience représente un couple ordonné : = (i, k) où i, k € J, i étant le nombre de 
points du premier dé et k celui du deuxième. Il est commode de représenter les 
épreuves sous la forme de points du plan (i, k), comme il est montré sur la figu- 
re 5-1. On voit que l’espace des épreuves se compose de 36 points Z — {(1,1), 
(1,2), . .., (6,6)}. Les événements possibles 
sont très variés ici. Désignons par S; l'évé- k 
nement de l'apparition de j points. Alors DT 
Sa = {(1,1)}; S7 = (4,6), (2,5), (8,4), (4,3), ÊF ONE 9 0 
(5,2), (6,1)}; Su = ((6,5), (5,6)}h Si — 5 NN 
—{(6,6)}, etc. 9 SO NQ 9 9 0 

Les événements qui peuvent se produire 4 VON 
sur l’espace fini des épreuves Z complété de O0 OXOXO © o 
l'ensemble vide g forment la classe des NON 
événements ÿ appelée classe finie additive, ou Ÿ O0 © ONoNo o 


O 
O 


corps booléen, où algèbre de Boole. Elle satis- NON 

fait aux conditions suivantes: 2 90 © o Oo Ne s 
si SEX, alors SE; 1 |- o WON7 
si S,6S et SE, alors SIUS. ES. o 9 © Oo 0) 
Appliquant ces deux conditions l’une pt 1 1 


après l’autre, on montre que la réunion ou 9 7 2 3 4 5 6 
l'intersection d’un nombre fini arbitraire 
d’ensembles S, du corps booléen #, ainsi que 
la différence de tels ensembles, appartien- 
nent à %. 

Si l’espace Z contient un nombre fini 
d'éléments, la classe des événements pos- 
sibles dans cet espace sera aussi finie. Il est commode de définir alors une 
classe #, d’ensembles dans l’espace Z, qui sera appelée classe initiale. Appli- 
quant les conditions mentionnées un nombre fini de fois aux ensembles de %,, 
on obtient la classe complète des événements vérifiant ces conditions, c.-à-d. 
un corps booléen %. On dit alors que le corps booléen * est engendré par la 
classe initiale #,. 11 y a de nombreux modes de choix de la classe initiale %, et 
chacun d’eux donne lieu à un corps booléen particulier. 

Exemple 5-2. Si %o =Z7, alors ZE%. Donc, Z = g E%. Comme 
ZUg=Z2 «tt 2N gg — gg, il vient que S — {Z, } est un corps booléen. 

Exemple 5-3. Supposons que #, se compose de tous les événements élé- 
mentaires dans Z. Dans ce cas le corps booléen % contient l’ensemble vide, tous 
les ensembles à un élément de Z, tous les ensembles à deux éléments de Z,... 
et, enfin, l’ensemble Z lui-même. 


Fig. 5-1. Espace des épreuves 
pour le cas où l'on jette deux 
és 


b) Notion de probabilité 


En théorie des probabilités, on considère chaque épreuve liée 
à une expérience z € Z comme une variable aléatoire. Cela veut dire 
qu’on ne sait pas à l’avance laquelle des épreuves aura lieu à la suite 


126 CH. 5. ASPECTS ENSEMBLISTES DE LA THÉORIE DES PROBABILITÉS 


de l'expérience. Or, il est clair que, premièrement, chaque expé- 
rience donne lieu nécessairement à une certaine épreuve z € Z et, 
deuxièmement, jamais deux épreuves ne se produisent simultanément 
après une seule expérience. 

Intuitivement, on conçoit que la probabilité de l'épreuve est 
une quantité mesurant la possibilité objective du cas donné (de l’é- 
preuve donnée). Par là même, on associe à chacun des éléments : € Z 
un certain poids p, c.-à-d. un nombre réel positif assujetti à certaines 
restrictions, à savoir: 

1) p est d'autant plus élevé qu'il y a plus de certitude quant à la 
réalisation de l’épreuve donnée z € Z au détriment des autres; 

2) la somme des poids p de tous les cas possibles doit être égale 
à l'unité. , 

Si l’on associe: à un certain élément z € Z le poids p = 0, cela 
veut dire que ce cas est impossible: il s’agit donc d’un événement 
impossible. Si un élément z € Z a le poids p = 1, le cas donné est 
un événement certain. En effet, en vertu de la restriction 2) tous les 
autres éléments de l’ensemble Z doivent avoir les poids p = 0, 
de sorte que les événements correspondant à ces éléments sont impos- 
sibles. Or, du moment qu’une épreuve doit se produire obligatoi- 
rement à la suite de l'expérience, ce sera justement celle qui a le 
poids p = i. 

La totalité des poids associés aux différents éléments de l’ensem- 
ble Z représente un certain ensemble P d'éléments p, tandis que le 
processus d’affectation des poids représente l’application de l’ensem- 
ble Z sur l’ensemble P ; les probabilités p € P se définissent donc 
en fonction des épreuves z € Z, ce qui peut être écrit sous la forme 


= p (2). (5-3) 


Conformément aux contraintes énoncées ci-dessus, les quantités 
p (z) représentent des nombres réels vérifiant les conditions 


p(2)>0; 2Pr@=t1. (5-4) 


La totalité des poids p (z) pour tous les z € Z constitue la dis- 
tribution des probabilités sur l’espace des épreuves Z, et chaque poids 
p € P associé à une épreuve élémentaire z € Z est la probabilité de 
l'épreuve donnée. 


c) Probabilité d’un événement aléatoire 


Nous venons de définir l’événement aléatoire S$ comme un cer- 
tain sous-ensemble de l’ensemble des épreuves Z liées à une expérien- 
ce. Donc, l’événement aléatoire est l’ensemble réunissant certains élé- 
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ments de Z. Dans ce cas on entend par probabilité de l'événement 
S, désignée par P,4 ou par P (S), la somme des poids des éléments 
constitutifs de cet événement: 


P(S)=Ps= Y p(2). (5-9) 


zES 


Signalons deux cas particuliers de cette formule: 

1) S ne contient aucun élément de Z, c.-à-d. qu’il est un ensemble 
vide; conformément à (5-5), la probabilité de l’ensemble vide est 
nulle : 


2) S se confond avec Z, c.-à-d. qu'il contient toutes les épreuves 
possibles. Comme aucune épreuve ne peut exister en dehors de Z, 
il est légitime de considérer l’espace Z dans sa totalité comme l’en- 
semble universel et lui associer le poids 1. Cela ne contredit nulle- 
ment la formule (5-5), qui, considérée conjointement avec (5-4), 
donne: 


P;=2 p(z)=1. (5-7) 
2CZ 


C2 


d) £space de probabilité 


Les raisonnements précédents relatifs à la définition des probabi- 
lités ont un caractère quelque peu intuitif et ne garantissent pas la 
possibilité de calculer les probabilités des groupes d'événements ar- 
bitraires susceptibles de se produire dans la classe des événements 
%. Pour résoudre ce problème, il convient de considérer la distribu- 
tion des probabilités non pas sur l’espace des épreuves Z mais sur 
la classe tout entière % des événements liés à cet espace. 

La mesure de probabilité sur une classe des événements % repré- 
sentant un corps booléen est la fonction réelle P (S) vérifiant les 
conditions suivantes: 

1) P (S) > 0 pour tout SE; 

2) Si Sy, S9 -+ + +; 9n est la suite d'événements de % incompati- 


bles deux à deux, on a P (U S,)= Ÿ P (S3): 
k— 1 K= 1 


3) P (2) = 1. 

Le couple (%, P), c.-à-d. le corps d’ensembles et la mesure de 
probabilité définie sur lui, porte le nom de champ de probabilité. 

Le triplet (Z, %, P), c.-à-d. l’espace des événements élémentaires, 
le corps d’ensembles défini sur cet espace et la mesure de probabilité 
définie sur ce corps, porte le nom d’espace probabilisé ou d'espace de 
probabilité. 
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5-2. CALCUL DES PROBABILITÉS 


a) Méthodes d'affectation de la mesure de probabilité 


I1 existe plusieurs méthodes pour associer des poids aux différents 
éléments z de l’espace Z. Le choix de la méthode à appliquer dans tel 
ou tel cas est déterminé par la nature de l’expérience envisagée et de 
l'information dont nous disposons. Considérons quelques méthodes 
principales. 

1. Détermination de la probabilité au moyen de la fréquence. 
Supposons que l'expérience ayant l'espace des épreuves Z — 
= {z,, ..., 2m} puisse être répétée un grand nombre de fois dans 
les mêmes conditions. Supposons qu’on ait procédé à V expériences 
et que le cas z € Z qui nous intéresse se soit produit , fois. Le nom- 
bre relatif de réalisations de z, c.-à-d. la quantité 


q (2) TN ? (5-8) 


est la fréquence de z. On s'assure sans peine que les fréquences q (z) 
des épreuves possibles z € S vérifient les conditions (5-4). 

\ Le nombre d'expériences n'étant pas élevé, la fréquence a un 
caractère manifestement aléatoire. C’est ainsi qu’en jetant une pièce 
de monnaie 10 fois, il arrive qu'on obtienne pile 2 fois, et aux 10 
coups suivants, par exemple, 8 fois. Or, la pratique montre qu'avec 
l'accroissement du nombre des expériences la fréquence des cas iso- 
lés perd sensiblement son caractère aléatoire et tend (avec certaines 
oscillations) vers une certaine valeur moyenne, laquelle peut juste- 
ment être assimilée à la probabilité de l'événement. Il importe de 
noter toutefois que cette tendance de la fréquence vers la probabilité, 
qu’on observe en augmentant le nombre des expériences, n’est pas 
la tendance vers une limite dans le sens mathématique. 

Par exemple, il n’est pas impossible qu’en jetant la pièce de 
monnaie 10 fois on obtienne 10 fois pile. Du moment que le résul- 
tat de chaque coup ne dépend pas des résultats précédents, il n’est 
pas moins possible qu'on obtienne pile 1000 fois sur 1000 coups. Or, 
la probabilité d'un pareil événement est si infime que l'événement 
peut être considéré comme pratiquement irréalisable. 

De façon générale, quand on multiplie les expériences, la fréquen- 
ce tend vers la probabilité au point que la probabilité d'un écart 
quelque peu sensible de la fréquence par rapport à la probabilité 
devient négligeable. Donc, pourvu qu'on ait la possibilité de ré- 
péter l’expérience un grand nombre de fois dans les mêmes conditions, 
les fréquences des différentes épreuves q (z) peuvent être retenues en 
qualité des probabilités correspondantes. Les questions relatives au 
aombre d'expériences que l’on peut considérer comme suffisant en 
déterminant la probabilité au moyen de la fréquence et au degré de 
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certitude des résultats obtenus par cette méthode seront traitées plus 
en détail dans les paragraphes consacrés aux méthodes de statistique 
mathématique. 

Cependant, vu les difficultés liées aux répétitions multiples de 
l'expérience dans les conditions réelles, on est obligé d’avoir recours 
à d’autres méthodes de détermination de la probabilité. 

2. Assez souvent (mais pas toujours) on peut utiliser la méthode 
basée sur le principe d'égale probabilité. 

Ce principe entre en jeu lorsque nous n’avons aucune raison d’ac- 
corder la préférence à une épreuve au détriment des autres. On con- 
sidère alors que toutes les épreuves sont également probables. Si 
l'espace des épreuves Z est constitué par m éléments, tandis que 
l'événement S contient r éléments de Z, la probabilité de cet évé- 
nement sera 


P(S)=—. (5-9) 


3. La méthode la plus utilisée de détermination de la mesure de 
probabilité est la recherche des probabilités a priori. Ces probabili- 
tés sont déterminées en accumulant les données statistiques sur 
l'événement ou le phénomène en question pendant une période pro- 
longée. 

Généralement, dans diverses branches de la science, de la techni- 
que et de la vie sociale, on enregistre les données statistiques pour les 
événements ou phénomènes se rapportant à la catégorie des choses 
aléatoires, c.-à-d. accidentelles, dont les régularités ne se prêtent pas 
à la définition mathématique rigoureuse et dont l'apparition ne 
peut être prédite avec certitude. Apprenant la fréquence d'apparition 
de cet événement dans le passé, on arrive à établir sa probabilité 
et, partant, à prédire, avec un certain degré de certitude, l’apparition 
de cet événement à l’avenir. 

4. Les probabilités a priori ne sont justifiables que si les condi- 
tions dans lesquelles l'événement s’est produit dans le passé existent 
au moment actuel. Or, bien souvent, ce n’est pas le cas. Aussi impor- 
te-t-il de préciser les conditions réelles existant au moment actuel: 
on y parvient en procédant à une expérience spéciale. Les probabi- 
lités recherchées tant à la base des données statistiques pour la pé- 
riode écoulée qu'à la base de l’expérience spéciale portent le nom de 
probabilités a posteriori. 


b) Propriétés de la mesure de probabilité 


Certaines propriétés de la mesure de probabilité s'avèrent fort 
utiles pour simplifier les calculs des probabilités. Examinons ces 
propriétés pour les événements X, et X, sur l’espace des épreuves Z. 


9—0732 
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1. Si X;\ NX: = ©, alors 
P(XiUX:) = P(Xi) + P (X:), (5-10) 


ce qui découle directement de la définition de la mesure de probabi- 
lité. 
2. A partir des conditions X{IJX = Zet XfN]X —=@, on trou- 
ve: 
P(XUX)=P(X)+P(X)=1, (5-11) 
d’où 
P(X)=1—P (X). (5-12) 


3. Soit X,= X,. Alors X, peut être représenté sous la forme 
Xe = XiU(X2 Xi), avec Xi1f) (Xe NX ÀX1) = ©. Donc, P (X.)= 
= P(X,) + P(X, Xi). Puisque X, X X, € Z et, par conséquent, 
P(X2  X1) > 0, on a: 


P (X3) > P (X)); (5-13) 
P(X2 X Xi) = P(X3) — P (Xi). (5-14) 


&. Pour X, et X. arbitraires appartenant à Z, représentons leur 
réunion comme la réunion de deux ensembles disjoints : 


XaU Xe = Xi U[Xe (Xi N X2)}; (5-15) 
de sorte que 


P(XiU Xe) = P (Xi) + P [Xe (AN ZX). (5-16) 


Puisque X,NXÂ.= X:, on a 
P(XiUX:) = P(X1) + P(X2) — P (Xi À). (5-17) 


Exemple 5-4. On tire au hasard une carte d’un jeu de 52 cartes. Quelle est 
la probabilité de tirer: 

1) un cœur ou le roi de trèfle? 

2) un cœur ou un roi? 

Désignons par X l’ensemble des cœurs, par Y l’ensemble des rois, par 


V le roi de trèfle, de Fat je P(X) = 1/4, P(Y) = 1/13, P (V) = 1/52 
1. Cherchons P (X Puisque XNV=g, on a P(XÙU V) = 


= P(X) + P Messe T 


pÀ Cherchons P(XUY). Puisque XUYZS, on a P (XUY) = 
= P(X)+P(Y)— P(XNY). Or, XNY est le roi de cœur, donc, P (Xf 
NY) = 1/52. Il vient 


1 1 1 4 
PAUP= THE 5 
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5-3. PROBABILITÉS CONDITIONNELLES 


a) Notion de probabilité conditionnelle 


Considérons un événement T dans l’espace des épreuves Z. Par 
définition, la probabilité de cet événement est 


P(T)= > p(2). (5-18) 
z€T 


Supposons maintenant qu’on a appris qu’un autre événement S 
vient de se produire. On demande de déterminer de quelle façon le 
fait de savoir la réalisation de S affectera-t-il la probabilité de 7? 

La probabilité d'un événement 7 soumise à la condition de réali- 
sation d’un autre événement $ porte le nom de probabilité condition- 
nelle de l'événement T et se désigne par Ps (T) ou par P(T]|S). 
Au contraire, la probabilité P (T) est la probabilité absolue, ou in- 
conditionnée, de l'événement T. Il s’agit de rechercher la relation 
existant entre ces deux probabilités. 

Prenons d’abord le cas élémentaire. Admettons que l’ensemble 
T ne comporte qu’un seul élement z € Z. En déterminant la probabi- 
lité inconditionnée p (z), nous supposons que n’importe quel z € Z 
peut se produire. Le nombre d'expériences étant suffisamment élevé, 
on a 
Nombre d'expériences avec 2€ Z donné M: 


=. (5-19) 


p(z)= Nombre total d'expériences N 

En imposant la condition de réalisation de l'événement S, on 
élimine automatiquement les épreuves ne confirmant pas la réali- 
sation de S. Pour cette raison. en cherchant p (z | S), on doit chan- 
ger N en Vs, nombre d'expériences ayant amené S, et Nen N,, 5» 
nombre d'expériences ayant amené tant z que $. Or, dans le cas con- 
sidéré 


z sizES;: 
— — -20 
G, S)=2NS ones. (5-20) 
Aussi Ve: s = N:ns. De cette façon, 
Nns 
PIS) =. (5-24) 


Divisant le numérateur et le dénominateur de cette expression 
par le nombre total d'expériences W, on obtient: 


S 
p(ls)= 2. (5-22) 


Passons maintenant au cas où 7 est un sous-ensemble arbitraire 
de l’ensemble Z. Se rappelant que la probabilité de l'événement est 


0 
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égale à la somme des probabilités des éléments constitutifs de cet 
événement, on obtient: 


SD PtENS) 


zET 


Examinons de plus près la somme figurant au numérateur. Elle 
est formée uniquement par les termes pour z € T. D'autre part, on 
peut négliger dans cette somme les termes pour zé S, vu qu’on 
a alors p (zfN\S) — 0. La somme en question se compose donc des 
termes vérifiant les conditions z € T et z € S. On peut donc sommer 
sur z2E€ETNS. Or, pour z2ES, on a p(zNS) = p (:). 


Aussi 

Dp(aNS)= À p()=P(TNS), (5-24) 

:€ET: 2€ETNS 

et l'on a: 
__P(TNS) 

P(TIS) = PS) (5-25) 

ou, dans les notations plus usitées, 
P(TNS)=P(T]IS)P(S). (5-26) 


Parfois, le fait de savoir S réalisé n'affecte aucunément la pro- 
babilité de 7. En d'autres mots, que S se soit produit ou non, la 
probabilité de T reste inchangée, de sorte que 


P(TIS)=P(T). (5-27) 


On dit alors que 7 et S sont des événements indépendants. De 
pareils événements vérifient la relation 


P(TNS)=P(T)P(S) (5-28) 


connue sous l'appellation de la formule des probabilités composées. 


b) Variables aléatoires à deux dimensions 


__ Très souvent, à la suite de l'expérience, nous cherchons à savoir 
non pas une mais plusieurs variables aléatoires, par exemple deux, 
z et y. C’est ainsi qu’en tirant une carte du jeu, ce sont à la fois sa 
‘couleur x et sa valeur y qui nous intéressent. Choisissant dans la 
forêt les arbres pour la construction, nous faisons attention à la hau- 
teur de l’arbre x et à son diamètre y. Vérifiant le bon état d’un con- 
densateur, nous établissons sa capacité x et la tension de claquage y. 

Dans tous ces exemples on a affaire à deux ensembles de variables 
aléatoires X — {x, ..., x,} et Y — {y1, . .., yn}. Cependant ces 
ensembles ne sont pas indépendants mais liés entre eux d’une façon 
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déterminée: l’épreuve z d’une expérience unique donne lieu à deux 
variables aléatoires x € X et y € Ÿ, de sorte que z = (zx, y). Ainsi 
donc, l’ensemble des épreuves Z est le produit direct des ensembles 
X et Y: 

Z=XXxX#T. (5-29) 


Considérons quelques événements et leurs probabilités, que nous 
chercherons à savoir en examinant des variables aléatoires à deux 
dimensions. Pour illustrer les notions qui vont être introduites, nous 
reprendrons l’exemple de la hauteur z et du diamètre y des arbres 
dans la forêt. 

Supposons qu’une expérience ait pour résultat deux épreuves 
zEXetyEY, par exemple zx — 30 m et y — 25 cm. Les probabili- 
tés suivantes seront alors à considérer : 

1) p (x), probabilité pour que la hauteur de l'arbre soit de 30 m, 
abstraction faite de son diamètre; 

2) p (y), probabilité pour que le diamètre de l’arbre soit de 25 cm, 
abstraction faite de la hauteur de l'arbre. Les probabilités p (x) 
et p (y) sont les probabilités inconditionnées des paramètres x et y 
et fournissent les distributions des probabilités respectivement sur 
les ensembles X et Ÿ de sorte que les conditions (5-4) soient vérifiées ; 

3) p (x, y), la probabilité pour que l'arbre ait la hauteur de 30 m 
et le diamètre de 25 cm. C'est la distribution commune des probabili- 
tés de deux paramètres x et y définie sur l’espace Z — X X Y d'’éle- 
ments z = (x, y) et vérifiant les conditions suivantes: 


p(x, y)>0, Pt y) = 1; (5-30) 


4) enfin, il se peut qu'on ait à considérer la probabilité condition- 
née p (x | y), c.-à-d. la probabilité pour que l'arbre de 25 cm de dia- 
mètre ait la hauteur de 30 m; dans ce cas, on néglige simplement les 
arbres d’un diamètre autre que 25 cm. 

Pour établir la relation entre les probabilités énumérées, dési- 
gnons par zx; uneépreuve x € X et par y; une épreuve y € Ÿ et consi- 
dérons dans l’espace Z = X X1Ÿ deux événements T; = {(x;, y), . .. 
us (is Um} et Sy = (as Vi), +. (ns Vi)}. 

L'événement 7’; consiste dans la réalisation de l'épreuve donnée 
z; E X et d’un quelconque y € Y. Comme l'expérience donne toujours 
naissance à un certain y € Ÿ, l'événement T7; se réduit à la réali- 
sation de z;. On a donc 7’; = x;. De même S; = y;. Il est facile 
de voir par ailleurs que T;NS;, = (x;, y;). Par la formule (5-25), 
on trouve: 

_ P(xi, yj) _ 
P(rily;)= pU) (5-31) 

Du moment que zx; peut être n'importe quel x € X et que y; peut 

être n'importe quel y € Ÿ, on a, en omettant les indices, pour tout 
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zEX et pour*tout y € Y: 
__ P(z, y) _ 
PEYN= ES, (5-32) 
ou, ce qui revient au même, 


P(z y) =p(xzly)p (y). (5-33) 


Si la probabilité de l'épreuve x ne dépend pas de la réalisation 
d’une épreuve concrète y, les épreuves zx et y sont indépendantes. 
De telles épreuves vérifient la relation 


p(z|y)=p(x), (5-34) 
de sorte que la formule (5-33) devient 
P(x, y) =p(x)p(y). (5-35) 


Remarquons qu’en considérant une variable aléatoire à deux 
dimensions, aucune importance n'est attachée à ce que l’une des 
variables, x ou y, soitila première et l’autre la deuxième. Permutant 
z et y dans la formule (5-33), on a 


px y)=pylzx)p (a). (5-36) 
Comparant (5-33) et (5-36), on constate que 
P(z y) =p(G)pylz)  =p(G%)p(ly). (5-37) 


c) Formule de la probabilité totale 


Considérons un espace d'épreuves Z. Soient T = Z un événe- 
ment dans l’espace Z, et le système d’ensembles {$S,, ..., S,} 
une partition de cet espace, de sorte que 


Z=Sil .. US, SNS» = © pour ik. (5-38) 


Assez souvent, il y a intérêt à définir la probabilité incondition- 
née de l'événement 7 au moyen des probabilités conditionnelles 
P(TIS;), ..., P(T|S;) et des probabilités inconditionnées 
P (Si), 3 P (Si). 

Pour avoir la relation cherchée, donnons à l’espace des épreuves 
Z la forme Z = S,{JS,, où S, = S,U... US: Alors 


P(T)=P(T|S:US:)= PITN (SiU S1)] — : 
=P(TAS)+P(TANS:). (5-39) 


Considérons S, comme un nouvel espace d'épreuves Z;, c.-à-d. 
Zi = S, = SU... US: ou Si, = SeUS a, où Sa = Sal .. 
..-. US, Alors 5) 


P(TNS:)== PITN (S2US:)] = P(TNS:)+ P(TAS:). (5-40) 
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Donc 
P(T)=P(TNSi)+P(TANS:) + P(TNS:). (5-41) 
Poursuivant les transformations analogues, on aboutit à 
P(T)=S P(TNSH)=E P(T|S:) P (Si), (5-42) 


formule connue sous le nom de formule de la probabilité totale. 


5-4. VARIABLES ALÉATOIRES CONTINUES 
ET LEURS DISTRIBUTIONS 


a) Notion de variable aléatoire continue 


Nous avons supposé jusqu'ici que l’espace des épreuves Z e-t un 
ensemble fini. Or, dans bien des cas, l'épreuve z liée à une expérience 
est une Valeur quelconque se situant dans un certain intervalle 
a < z < b. Dans ce cas z est une variable aléatoire continue dont 


l'espace des épreuves se confond avec toute la gamme de ses valeurs 
possibles : 


Z = {::a<Lz< b}, (5-43) 


contenant une infinité de points. On ne peut plus parler alors de la 
probabilité d'une épreuve isolée, car, le nombre des épreuves étant 
infini, le poids de chaque épreuve sera égal à zéro. Aussi la distribu- 
tion des probabilités pour une variable aléatoire continue diffère-t- 
elle de la distribution pour le cas discret. On a deux modes de distri- 


bution, connus sous le nom de fonction de répartition et de densité 
de probabilité. 


b) Fonction de répartition 


Soient Z l’espace des épreuves pour une variable aléatoire à une 
dimension admettant des valeurs réelles, et À l’ensemble des nombres 
réels, dont les éléments seront désignés par x. La fonction de répar- 
lition des probabilités F(x) définit la probabilité pour que la va- 
leur de la variable aléatoire z ne soit pas supérieure à un x 
donné : 


FH =P(—o<2<). (5-44) 


On arrive à se faire une idée générale de la fonction F (x) en se 
basant sur quelques propriétés qu’elle possède : 

1. Puisque pour zx, > zx, l'intervalle (— ©, x.] est contenu 
tout entier à l'intérieur de l'intervalle (— ©, x;,], on a en vertu 


de (5-44) F (x,) > F (x). Par conséquent, F (x) est une fonction non 
décroissante. 
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2. F (— oo) — 0, car l'épreuve 5 € (—oo, x] s'avère impossible 
quand x —> — co. 

3. F(- oo) — 1, car l'épreuve z € (— oo, x] devient certaine 
quand zZ —> + oo. 

L'’allure générale de la fonction vérifiant les propriétés définies 
est donnée sur la figure 5-2. 


c) Densité de probabilité 


Connaissant la fonction de répartition, on calcule la probabilité 
pour que la valeur de la variable aléatoire soit comprise dans un in- 
tervalle réduit, entre x et x + Az. En vertu de (5-44), cette probabi- 
lité est égale à | 


F(z+Az)—F(z)= FERII PA Az. (5-45) 


Le premier facteur du second membre de cette expression est la 
valeur de la probabilité par unité de longueur Az de l'intervalle. Si, 


F(T) 


w(x) 


tj 


(4 Z 


Fig. 5-2. Fonction de répartition Fig. 5-3. Graphique de la densité de 
d’une variable aléatoire continue probabilité 


pour Ar —+ 0, la limite de cette expression existe, ce qui est générale- 
ment le cas pour la plupart des variables aléatoires continues, cette 
limite se désigne par w (x) et reçoit l’appellation de densité de proba- 
bilité. De cette façon, 


w (x) = lim FER FE ., (5-46) 
Ax 0 T 
de sorte que 
F (x + Az) — F (x) = w (x) Az. (5-47) 


On voit sur la figure 5-3 la forme générale du graphique de la 
fonction w (x). 

Mettons au clair quelques propriétés de la fonction w (x). Soient 
a et bdes points arbitraires de l'axe réel tels que b >> «. Cherchons la 


signification de l'intégrale Î w (x) dr. Substituant tout formelle- 
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ment dF (x) à w (x) dx, on obtient: 


b F(b) 
| w (x) dr — | dE (x)=F(b)—F(a). (5-48) 
a F(a) 


Or, en vertu de (5-44,) cette expression est la probabilité pour que 
la variable aléatoire z prenne une valeur située dans l'intervalle 
(a, b). Ainsi donc, 

b 


P(a<z<b)=— | w (x) dr. (5-49) 
Cette formule a un cas particulier 
+ 00 
\ w(z)dr=1, (5-50) 


— oO 


montrant que l'aire limitée par la courbe de densité w (x) et l’axe des 
abscisses est toujours égale à l'unité. 

La formule (5-49) permet d'établir la liaison entre les fonctions 
F (x) et w (x) sous une forme intégrale. Comparant (5-44) avec (5-49), 
on trouve: 


F(r)= | w(E)d. (5-51) 


La notion de fonction de répartition et celle de densité de probabi- 
lité s'étendent aisément au cas d’une variable aléatoire multidimen- 
sionnelle [33, 35]. Sans nous arrêter sur cette question, passons à l’exa- 
men de quelques lois de distribution des variables aléatoires con- 
tinues. 


d) Distribution uniforme 


Si une variable aléatoire peut prendre avec probabilité égale des. 
valeurs quelconques dans un intervalle de l’axe réel entre « et B et. 
n’en peut prendre aucune qui soit en dehors de cet intervalle, c.-à-d. 
possède la densité de probabilité 


1 | 
=] pa” <<: (5-52) 


O, z<a, z2>$, 
on dit de cette variable qu’elle est distribuée uniformément dans l'in- 
tervalle [œ, BJ. 


Il est commode de caractériser la distribution uniforme par les 
paramètres v = (& + B)/2 et w = B — «, appelés valeur moyenne 
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et étendue de la distribution, et de la désigner donc par R (v, o). 
On exprime sans peine la densité de probabilité w (z) par les para- 
mètres de la distribution R (v, w) sous la forme 


{ 
| V5 <i<v+: 

w (z) =: (5-53) 
Lo, 2 V—+., 2>V+—.. 


Exemple 5-5. Quand on arrondit des nombres quelconques aux valeurs 
entières, les erreurs d'arrondissement peuvent prendre avec probabilité égale 
des valeurs de —0,5 à +0,5, c.-à-d. qu’elles obéissent à la distribution Æ (0, 1). 

Exemple 5-6. Quand on fait des lectures sur une échelle graduée en 6, les 
erreurs de lecture seront des variables aléatoires à distribution R (0, 6). 

Exemple 5-7. Si le trafic du trolleybus s'effectue avec des intervalles de 
10 mn, le temps d'attente pour un passager ignorant l'horaire du trafic sera 
une variable aléatoire caractérisée par la distribution R (5, 10). 


e) Distribution normale 


La loi la plus importante de distribution d’une variable aléatoire 
est la loi normale, ou la loi de Gauss. La plus fréquente dans la prati- 
que, elle est aussi la loi limite vers laquelle tendent de nombreuses 
autres lois de distribution jouant dans des conditions fort typiques. 

La loi normale se caractérise par la fonction de densité de la forme 


(2-v): 
1 7 7292 
Vo e “9 (5-54) 


pour — 00 << Z2<< + oo. La distribution normale se définit par les 
paramètres v et 0°, dits moyenne et variance; elle sera désignée par 


w (z) := 


Fig. 5-4. Graphique de w (z:) pour la distribution normale 


la suite N (v, 0°). On voit sur la figure 5-4 le graphique de la fonction 
(5-54) pour v = 1, 0 et pour quelques valeurs de ©. 

En théorie des probabilités, on attache une importance considé- 
rable à savoir la probabilité pour que la variable aléatoire tombe sur 
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un intervalle donné de l'axe réel (a, b). Dans le cas de la distribution 
normale cette probabilité est 


(z-v) 


P(a<z<b)= 7 207 Gz. (5-55) 


= | 
—— | € 
Vino J 

On met cette expression sous une forme plus commode par chan- 
gement de variable, en désignant (z — v)/o = t. On a alors dt — 
= dz/0 et 


b-v 


6 i 2 
P(a<z<b)= | e 2?" dt. (5-56) 


1 
VA, 


(] 


1 
_it _, 
Or, l'intégrale de la forme | e * dt ne peut être exprimée au 


moyen de fonctions élémentaires. Aussi, pour le calcul de (5-56), 
a-t-on recours aux tables d’une fonction spéciale 


1 ( -2r _ 
D = —_— | 2 dt, 5-; { 
D | ° (5-57) 
appelée intégrale de probabilité, qu’on trouve dans la plupart des 
ouvrages consacrés au calcul des probabilités, par exemple dans [36]. 


Compte tenu de (5-57), la probabilité pour que la valeur aléatoire 
se situe dans l'intervalle (a, b) s'exprime par 


P(a<z<b=0(—)-0 (=). (5-58) 


Effectuant les calculs d’après la formule (5-58), il est utile de 
se rappeler les propriétés suivantes de l'intégrale de probabilité: 


D(0)=0; D(+oæ)= +; D(—z)=—D(r) (5-59) 


5-5. CARACTÉRISTIQUES NUMÉRIQUES 
DES VARIABLES ALÉATOIRES 


a) Notion de caractéristiques numériques 


La fonction de répartition ou la densité de probabilité sont les 
caractéristiques les plus complètes des variables aléatoires. Or, il 
existe un grand nombre de problèmes pratiques où il s'avère difficile 
ou même impossible de définir la fonction de répartition de façon 
complète. 

Par ailleurs, pour avoir la solution de nombreux problèmes, il 
suffit de connaître un petit nombre de paramètres caractérisant la 
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variable aléatoire sous tel ou tel point de vue. Les paramètres nu- 
mériques les plus employés, qui ont reçu l’appellation de caractéris- 
tiques numériques où de moments des variables aléatoires, sont la 
moyenne et la variance (ou écart quadratique moyen). Se déduisant 
sans peine des données expérimentales, elles aident à se faire une idée 
d'ensemble sur la nature de distribution de la variable aléatoire. 


b) Valeur moyenne (espérance mathématique) 
d’une variable aléatoire 


Dans de nombreux problèmes, la variable aléatoire est assimilée 
à une épreuve et s'exprime par un nombre réel. Voici quelques exem- 
ples de variables aléatoires admettant une valeur numérique: 

l'intensité du courant consommé par les locataires d’une maison; 

la tension électrique dans le réseau à un moment donné: 

la température de l’air à un moment donné de la journée; 

le nombre de points marqué par le tireur donné en tirant à la cible ; 

le nombre de particules cosmiques atteignant la surface terrestre 
à l’unité de temps; 

le nombre d'acheteurs dans le magasin à un moment donné, et 
ainsi de suite. 

Dans tous ces cas, une caractéristique numérique bien importante 
de la variable aléatoire est sa valeur moyenne (ou simplement sa 
moyenne), dite aussi espérance mathématique. 

Supposons que les éléments d'un espace des épreuves Z — 
= {z, ..., ZM} admettent une appréciation numérique. Si, au 
bout de W expériences, l’épreuve Z, a eu lieu r, fois, ..., z, a eu 
lieu r,, fois, de sorte que r, +... + rm = N, la valeur moyenne de 


la variable aléatoire z, désignée par M (z) ou z, est égale à 


m 
— ra... Hz r'; {0 
M (z) = 2 — An -tEmm LS Zi - (5-60) 
i=1 

Si le nombre d'expériences V était suffisamment élevé, la rela- 
tion r;/N = p; peut être interprétée comme la probabilité de l’épreu- 
ve z; Omettant les indices, on écrit la formule de la moyenne 
comme suit : 


M (2)=2= 2 2P (z). (5-61) 
2€ 


La moyenne M (2), déterminée par la formule (5-61), est souvent 
désignée sous le terme d'espérance mathématique de la variable aléa- 
toire z. 

La formule (5-61) peut servir à la détermination de la moyenne 
dans le cas où l’espace des épreuves Z est un ensemble fini. D'autre 
part, si z est une variable aléatoire continue caractérisée par une den- 
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sité de probabilité w (z), on peut admettre dans (5-61) que p (z) est la 
probabilité pour que la valeur de la variable aléatoire soit contenue 
dans les limites de z à z + Az, ce qui veut dire qu’on peut poser 
p(z) = w(z) Az. Passant à la limite pour Az 0 et remplaçant 
respectivement Az par dz et la somme par l'intégrale, on obtient: 


+ oo 
M(2)=2= | zu (z) dz. (5-62) 


—œo 


c) Valeur moyenne de la fonction 
d’une variable aléatoire 


Bien souvent, dans la pratique, on rencontre des problèmes où 
la variable aléatoire ne peut être exprimée par aucun nombre. Par 
exemple, la production d’une usine se divise en produits de bonne 
qualité et rebut. Quand on jette une pièce de monnaie, on a comme 
épreuve soit pile, soit face. Une carte tirée au hasard d’un jeu se ca- 
ractérise par sa valeur et sa couleur. Une impulsion radar réfléchie 
porte l'information relative à l’existence ou à l’absence de l'objectif, 
et ainsi de suite. Dans tous ces exemples les variables aléatoires n’ont 
qu'une différence qualitative, et non pas quantitative. Or, même 
lorsqu'il s’agit de variables n'ayant qu'une différence qualitative, 
on arrive généralement à les munir de caractéristiques quantitatives. 

Nous assimilons une variable aléatoire au résultat d’une expérien- 
ce, ou à une épreuve, l'expérience en question étant ou bien organisée 
de façon artificielle, ou bien survenant à la suite d’un processus na- 
turel. Rappelons-nous que toute expérience exige certains frais et 
qu’elle ne vise pas seulement à satisfaire notre curiosité mais plu- 
tôt à atteindre un but déterminé. Le cas qui se réalise à la suite de 
l'expérience sera considéré comme favorable ou défavorable, suivant 
que le but qu’on s’est assigné a été atteint ou non. Le fait de réaliser 
le but envisagé est un gain, ou un profit, et le fait contraire, une per- 
te, ou un dommage. Le profit et le dommage peuvent être exprimées 
tous les deux par des nombres, par exemple par certaines sommes de 
roubles. 

Ainsi donc, il est légitime d'associer à toute épreuve z € Z une 
appréciation numérique, donc de définir l'application f de l’espace 
des épreuves Z sur l’ensemble des nombres réels R 


f:Z— R. (5-63) 


Cette application nous fournit une fonction réelle f (z) définie 
sur Z, que l’on peut manipuler comme on ferait avec une variable 
aléatoire; proposons-nous de déterminer, en l'occurrence, sa valeur 
moyenne. 
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Soit f (z) une fonction numérique définie sur un ensemble Z. 
Cela veut dire qu'aux éléments z,, . .., zM de Z correspondent cer- 
taines valeurs de la fonction f (z,), . . ., f (2). Ces valeurs ont les 
mêmes probabilités que les variables aléatoires z,, . . ., z,. De cette 
façon, p (z) représente la distribution des probabilités autant pour la 
variable aléatoire z que pour la fonction de la variable aléatoire 
f (z). On peut donc rechercher la valeur moyenne de la fonction d’une 
variable aléatoire en employant les formules de la moyenne de la 
variable aléatoire par changement de (z) en f (z), c.-à-d. 


M [f(2)] =i@ 2 f(:) p(2) (5-64) 


pour une variable aléatoire discrète et 
+o 
MUY(GN=F@= | f()w(2) de (5-65) 


pour une variable aléatoire continue. 

Notons que la quantité f (z) calculée par (5-64) dépend de la dis- 
tribution p (z). Cela veut dire qu’une variation de la distribution des 
probabilités p (z) sur l’espace Z affecterait la valeur moyenne de la 


fonction f (z). Mettant en valeur cette circonstance, on désigne quel- 
quefois la valeur moyenne de la fonction f (z) par f (p) en posant que 


f (p)= f (a). (5-66) 


L'emploi de la même lettre f pour la désignation de la valeur 
moyenne de la fonction et pour la désignation de la fonction elle- 
même ne donne lieu ici à aucun malentendu, car les fonctions f (z) 
et f (p) sont définies sur des ensembles différents: la fonction f (z) 
l’est sur l’espace des épreuves Z, et la fonction j (p), sur l’espace des 
distributions possibles des probabilités p (z). 


Exemple 5-8. L'usine produit des appareils. La probabilité pour qu'un 
appareil soit rebuté est p. Quel est le profit moyen par appareil réalisé si a est 
le prix de revient et b le prix réclamé de l'appareil? 

Appliquant la formule (5-64), on trouve: 


f(p)=(b— a) (1 — p) — ap = b(1 — p) — a. 


Dans nombre de problèmes, on assimile la moyenne au gain 
moyen pour un grand nombre d'expériences. On admet dans pareils 
cas qu'il y a intérêt à procéder à l'expérience si f (z) = f (p) > 0. 

Une autre interprétation de la moyenne se présente quand on 
fait un pari. Supposons qu’un événement puisse se produire avec la 
probabilité p. Aux termes du pari, un parieur consent à payer une 
somme b si l'événement ne se produit pas, à condition que l’autre 
parieur paie une somme a si l'événement se produit. Ainsi donc, le 
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premier parieur a la probabilité p de toucher la somme a et la proba- 
bilité 1 — p de payer la somme b. Son gain moyen est 


f@)=ap—b({—p). (5-67) 


On admet que le pari est équitable si le gain moyen est nul, c.-à-d. 
si 


4 (5-68) 


Théorème 5-1 (théorème de la moyenne). Utilisant pour la défi- 
nition de f (p) l'expression (5-64) et remplaçant dans chaque terme f (2) 
par min f (z), on aboutit à la relation 


fQ@)>minf() 2, p()= min f (a) (5-69) 


qui exprime le théorème de la moyenne. 


d) Valeur moyenne de la fonction 
de deux variables aléatoires 


Dans bien des cas on a affaire non pas à un seul mais à plusieurs 
événements aléatoires et l’on introduit alors une fonction réelle 
dépendant des épreuves qui se réalisent à la suite de chacun de ces 
événements. Dans une épreuve d'athlétisme, par exemple, le résultat 
de chaque participant est un événement aléatoire; d’autre part, la 
place attribuée à l'équipe sera fonction tant des résultats des mem- 
bres de cette équipe que des résultats des membres de l’équipe ad- 
verse. 

Bornons-nous à considérer deux variables aléatoires indépendan- 
tes en désignant leurs espaces des épreuves respectivement par X et 
Y. Désignons par p (x) et q{(y) les distributions des probabilités 
sur les espaces X et Y. 

Soit f (x, y) une fonction réelle définie pour tousxz € X eye Y. 
On dit dans ce cas que la fonction f (x, y) est définie sur le produit 
direct des ensembles X X Y. La moyenne de cette fonction dépen- 
dra de la nature de la distribution des probabilités p (x) et q (y), 
de sorte que 


M{f(z, y) =f(x, y)=f(p, 0). (5-70) 


Pour définir f (p, g), donnons-nous un y € Ÿ déterminé. Quand 
y est donné, la fonction f (x, y) n’est fonction que de zx, et sa valeur 
moyenne, qui ne dépend que de p (x), peut être désignée par f, (y) 
et se déduira de la formule (5-64): 


M{f (y) = fp (y) = Di (s, y) p (x). (5-71} 
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La quantité f, (y) ne dépend plus de x mais seulement de y. En 
prenant sa moyenne suivant y on obtient précisément f (p, q): 


1, D=M IRON Eh UaU= Zi NPaU. (6-72 


e) Espérance mathématique conditionnelle 


Soient Z l’ensemble des épreuves et f (z) une fonction numérique 
définie sur Z et telle que sa moyenne (ou espérance mathématique) 
se définisse par (5-64). 

Supposons maintenant qu’un événement S= Z se soit produit. 
A ce moment-là la distribution des probabilités n’est plus p (z) mais 
p(zIS): c'est la distribution conditionnelle. Substituarit dans la 
formule de la moyenne p(z|S$) à p (z), on aboutit à l’espérance 
mathématique conditionnelle de la fonction f (z): 


MI9= D OPGIN=75 D PEN S)= 
2€Z 2:€Z 
D 1 PC) 
_ _2 5-7 
— ET . (5-73) 
:€S 


f) Propriétés de la valeur moyenne 


1. La valeur moyenne d'une variable non aléatoire est égale à 
la variable elle-même. 

Soit c une variable non aléatoire; il s’agit donc, en réalité, non 
pas d’une variable mais d’une constante. On peut admettre dans ce 
cas que c est l’épreuve dont l’espace Z n’a pour éléments que c seul, 
de sorte que p (c) = 1. On a par la formule (5-61): 


M (c) = cp (c) = c. (5-74) 
2. Le facteur constant peut être sorti de sous le signe de la moyen- 
pe: 
M (cz) = D, (z) = c. À dE (z) = cM (2). (5-75) 
3. La moyenne de la. somme de deux variables aléatoires est la 
somme de leurs moyennes. 
Soient x et y deux variables aléatoires distribuées sur les espaces 


des épreuves X et Ÿ avec les probabilités p (x) et qg(y). Notons 
Kz, ÿ) = av Par la formule (5-72), on a: 


z+y= À 2 +yr()au=  xp(a) > sU+X ya ()  p (x) = 
= 2 cp (0) + D un @) = 74. (5-76) 
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4. L'espérance mathématique d’une variable aléatoire centrée est 
égale à zéro. 


Soient z une variable aléatoire et v sa moyenne. La variable aléa- 
0 


toire z = z — vest dite variable aléatoire centrée. Elle a pour expres- 
sion 


M()=M(z—v=M (2 —v=0. (5-77) 


g) Moments. Variance. Ecart quadratique moyen 


Les caractéristiques numériques les plus importantes d’une varia- 
ble aléatoire sont ses moments, qui se divisent en initiaux et centrés. 

Le moment initial d'ordre s de la variable aléatoire z se définit 
par la formule 


as (2) = 2 2p(2 (5-78) 
pour une variable aléatoire discrète et par la formule 
+ 00 
@s (2) = | z'w (z) dz (2-79) 


pour une variable aléatoire continue. 


Il est facile de voir que la moyenne M (z) = z, désignée plus loin 
par v ou v., représente le moment initial du premier ordre «@, (2). 
Le moment initial du second ordre est la moyenne du carré de la varia- 
ble aléatoire : 


(= 2p()=M(2)=2. (5-80) 


Dans le cas où l’on utilise en qualité de variable aléatoire une 


0 
variable aléatoire centrée z — z — v, les formules (5-78) et (5-79) 
donnent les expressions pour les moments centrés d'ordre s, désignés 
par u.(z). On voit de la relation (5-77) que le moment centré du pre- 
mier ordre est nul. 

Une caractéristique numérique très importante d’une variable 
aléatoire est son moment centré du second ordre appelé variance 
de la variable aléatoire z et désigné par D (z) ou D... Les formules 
définissant la variance sont 


D()=u:(2 = 2 (2—v.) p() (5-81) 
pour une variable aléatoire discrète et 
+oo 
D(D=m(9= | G—v}w() d (5-82) 


10—0732 
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pour une variable aléatoire continue. La variance caractérise les 
écarts des différentes valeurs de la variable aléatoire par rapport 
à sa valeur moyenne, c.-à-d. qu'elle caractérise la dispersion de 
cette variable. Plus la variance est petite, plus les différentes valeurs 
de la variable aléatoire se concentrent autour de la moyenne. 

Dans bien des cas, la variance s’avère d'un emploi peu commode 
dans la pratique, car sa dimension est celle du carré de la variable 
aléatoire. Aussi adopte-t-on souvent, comme caractéristique de la 
dispersion d’une variable aléatoire, la racine carrée de la variance, 
désignée sous le terme d'écart quadratique moyen et notée par © 
ou 0: 


0, — VD (:). (5-83) 


Notons quelques propriétés de la variance. 
1. La variance d’une variable non aléatoire (constante) est égale 


à Zéro: 
D ()=Ml(c— c}] — M (0) = O. (5-84) 


2. Une constante peut être sortie de sous le signe de la variance 
en l’élevant à la puissance deux: 


D (cz) = MT (cz — cv)°] = cD (2). (5-85) 
D'autres propriétés de la variance seront examinées plus tard. 


h) Régression et corrélation 


Lorsqu'il y a plusieurs variables aléatoires, par exemple deux, 
la moyenne et la variance peuvent caractériser chacune d’elles iso- 
Jément. Or, en pareils cas, il importe beaucoup de connaître l'in- 
fluence exercée par une de ces variables 
sur l’autre, c.-à-d. de tenir compte de la 
liaison réciproque établie entre les va- 
riables aléatoires. La régression et la 
corrélation sont appelées justement à 
fournir l'expression quantitative de cette 
liaison. 

Soient z et y deux variables aléatoi- 
res, analogues à celles qu’on a examinées 
au $ 5-3. Pour fixer les idées, supposons 
que x est la hauteur et; y le diamètre des 
arbres dans un compartiment de la forêt. 
A chaque arbre correspondra un point sur le plan (x, y), tandis que 
la totalité des arbres aura pour expression l’ensemble des points de 
la figure 5-5. Dans le cas examiné les grandeurs v, = x et v, = y 
fournissent les valeurs moyennes de la hauteur et du diamètre des ar- 
bres, et ©, et o, caractérisent la dispersion de la hauteur et du dia- 
mètre par rapport à leurs valeurs moyennes respectives. 


Fig. 5-5. Ligne de régres- 
sion y (x) 
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En plus de la hauteur moyenne et du diamètre moyen, on attache 
un intérêt considérable à l’étude de la variation du diamètre en fonc- 
tion de la hauteur de l'arbre. Or, pour les arbres de même hauteur 
x, le diamètre y est une variable aléatoire. Aussi ne parlera-t-on que 
de la valeur moyenne du diamètre ÿ en fonction de la hauteur x, 
c.-à-d. qu’on se bornera à rechercher la seule valeur y (x) qui est la 
moyenne conditionnelle M (y|zx). Utilisant l'expression (5-73) 


et désignant par p (x, y) la probabilité commune des valeurs données 
de x et de y, on trouve: 


Vyp(x, y) 
y(x) = M — Ÿ 5-86 
y (x) (y| x) SET (2-86) 
UV 


Déterminant ÿ (x) pour différents x, on arrive à construire une 
ligne traduisant graphiquement cette fonction (voir fig. 5-5) et appe- 
lée ligne de régression dé y par rapport à x. On obtient par analogie 


la fonction x (y) — M (x | y), dite régression de x par rapport à y. 
Etudiant la régression, nous ne prendrons que le cas le plus sim- 
ple et le plus fréquent : il s’agit de la régression linéaire, avec la li- 
gne de régression se présentant sous la forme d’une droite d’équation 
y(r)=a+b(r— 7x). (5-87) 
Les coefficients a et b seront choisis de façon à concentrer au 
maximum les points (x, y) dans le voisinage de la droite ÿ (x), 
ce qu'on réalise en imposant la condition 
pa, b)= M {{y—y(x)}}= min. (5-88) 


La condition (5-88), conjointement avec (5-87), fournit le système 
d'équations suivant pour la détermination de a et de b: 


M Iy(x—x)] — boi = 0. G-89) 


Appelons covariance entre x et y la quantité 
Hay = Cv (x, y) = M [(y—y)(z—2)]. (5-90) 
Il est facile de voir que u., peut être représentée sous la forme 
May = My(z—2)—y(z—2)] = 
= M{y(z—2)\—yM(z-7)=My(z—2)]. (5-91) 


Compte tenu de (5-91), on tire de (5-89) Jes valeurs de a et de b 
définissant les lignes de régression : 


— Hzxy 
1 5ù 


(5-92) 


10% 
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La covariance u.,, est susceptible de servir de mesure de liaison 
réciproque existant entre deux variables aléatoires zx et y. Or, du mo- 
ment qu'on s’est borné au seul cas où la ligne de régression est une 
droite, la covariance ne caractérisera pas une liaison réciproque de 
nature quelconque mais seulement la liaison linéaire, aux termes de 
laquelle une variable aléatoire tend à croître ou à diminuer en moyen- 
ne suivant la loi linéaire avec l'accroissement ou la diminution d'une 
autre variable aléatoire. Pour mieux représenter le changement de la 

covariance en fonction de la liaison entre 


y deux variables aléatoires, il est utile 
9 d'examiner les cas extrêmes. 
O o © © © 14. x, — 0. Cela signifie que b = 0, 


y = a et la ligne de régression est hori- 


20 20 00 zontale, ainsi qu'il est montré sur la 
9 e} figure 5-5. On voit que, dans les points 
zx expérimentaux, les valeurs de y se grou- 


pent autour de la valeur de a, quelle que 

soit la valeur de z. Donc, dans le cas 

Fig. 5-6. Ligne de régres- donné, y et z sont des variables aléatoi- 
sion pour des variables aléa- Les indépendantes 
toires indépendantes . ° 

2. La liaison entre x et y sera plus 

prononcée quand ces deux variables seront 

liées par une dépendance fonctionnelle linéaire. Dans ce cas tous 

les points expérimentaux tomberont sur la ligne de régression, de 

sorte que y = y (x). Remplaçant y (x) par y, on récrit l'équation de 

la ligne de régression sous la forme 


y—y = Æ (x— 2). (5-93) 
Cherchons la variance 0, pour le cas donné: 
; — He 
Où = M [(y — y})*] = TE , (5-94) 
d'où 
Hxu — OxO ye (5-95) 


De cette façon, suivant que la liaison entre x et y est plus ou moins 
prononcée, la covariance u., change entre 0 et 0,0. 

La covariance u,, ne convient pas très bien pour apprécier le 
degré de liaison entre les variables z et y, du moment qu’elle dépend 
des variances des variables aléatoires elles-mêmes. A cette fin, on 
emploie plutôt le coefficient de corrélation 

Hxy 
Txy — x0y ? (9-96) 
qui varie de 0 (lorsque les variables aléatoires sont indépendantes) 
jusqu'à 1 (les variables aléatoires étant linéairement dépendantes). 
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La notion de covariance permet d'écrire des relations simples 
pour la moyenne du produit et la variance de la somme de deux 
variables aléatoires. Nous laissons au lecteur le soin de vérifier que, 
dans les cas indiqués, on a les relations suivantes: 


Ty — zy + Uxys (5-97) 

D(z+-y)= D (x)+ D (y) + May- (5-98) 

Quand les variables aléatoires x et y sont indépendantes, on a 
Ty =21y; (5-99) 

D (x + y) = D (x) + D (y). (5-100) 


5-6. PROCESSUS STOCHASTIQUES DISCRETS 


a) Catégories de processus stochastiques discrets 


Supposons qu'un système donné, soumis à l'influence de l’en- 
semble des conditions extérieures, puisse changer d'état, de façon 
aléatoire, à des instants discrets notés conventionnellement 0, 1, ... 
..., les intervalles entre ces instants étant désignés sous le terme de 
pas ou étapes. Ce système, à l’étape x de son évolution, prend l’état x, 
que l’on peut considérer comme résultat d'une expérience, ou épreu- 
ve, et qui constitue donc un élément de l’ensemble des épreuves pos- 
sibles à l’étape donnée: 


Zn =4{20, 21, ..., 21}. 


Nous admettons que l'ensemble Z, soit constitué d’un seul éle- 
ment z!, représentant l’état initial du système. La suite des états 
pris par le système x,, 1, . . . est appelée processus stochastique [71]. 

Pour que le processus stochastique soit défini, il faut qu’on con- 
naisse à chaque étape la distribution des probabilités sur l’espace des 
épreuves, définissant les états que le système peut prendre à l’étape 
suivante. Dans le cas général, cette distribution des probabilités 
dépend des états parcourus à toutes les étapes précédentes et se dé- 
finit, pour tout'n, par la collection des probabilités conditionnelles 


P(tnr1=2ht It, ...,%n), k=0,1,...,Ln  (5-101) 
avec 


L, 


n+1 
À P(Tnti=2x  |To, ..., In) = 1. (5-102) 
Le processus sera poursuivi à l'infini, à moins qu’il ne soit in- 
terrompu à dessein à une étape quelconque. En pratique, nous som- 
mes obligés toujours d’interrompre le processus après un certain nom- 
bre fini d'étapes, c.-à-d. d’avoir affaire aux processus dits finis ou 
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multiétapes. Or, les processus infinis sont d'’utiles appproximations 
des processus finis, plus réels, d’autant plus qu'ils s'avèrent bien sou- 
vent plus simples du point de vue analytique. 

Un processus stochastique dont nous ne pouvons modifier le dé- 
roulement ni, par conséquent, la distribution des probabilitites 
(5-101) est dit incontrôlable. 

En fonction du type de la distribution des probabilités (59-101), 
on distingue plusieurs catégories de processus stochastiques, dont 
les plus répandus sont les processus à valeurs indépendantes, les pro- 
cessus d'essais indépendants et les chaînes markoviennes. 

Un processus stochastique fini est dit processus à valeurs indé- 
pendantes si la distribution des probabilités sur l’espace des épreu- 
ves à chaque étape ne dépend pas des étapes précédentes : 


P(rn =2h| To. ., Zn-1) = P (Zn = 2). (5-103) 


Il est quelquefois plus commode de designer cette distribution 
des probabilités simplement par p, (z), où z2E€Z,, n — 0, 1, ... 

Une propriété fort importante d’un processus à valeurs indépen- 
dantes consiste en ce que toute suite d'états Zo, Ty, - - -, Zn peut 
être considérée comme un ensemble d'épreuves indépendantes. Par 
conséquent, la probabilité de réalisation d’une suite pareille est 
égale au produit des probabilités des épreuves constituant cette sui- 
te, ce qui peut être écrit sous la forme 


P (Zos Tir + + +, Zn) = Po (Co) Pa (ta) + - + Pn (tn); 
T; € Z;, L — 0, À, es NN. (5-104). 


Il existe un cas particulier important des processus à valeurs 
indépendantes: ce sont les processus d'essais indépendants. Le 
processus d'essais indépendants est un processus à valeurs indépendan- 
tes qui a, à chaque étape, le même espace des épreuves Z = {z, 
Z1 + + + ZL} et la même distribution des probabilités sur cet espace: 


Pn (Z) = Pm (2) = p (2) (5-105) 


pour tout z € Z et pour tous m et nr. En d’autres mots, le processus 
d'essais indépendants n'est qu'une répétition multiple d'un même 
essai dans les mêmes conditions. 

De même que pour les processus à valeurs indépendantes, la pro- 
babilité d'obtenir une suite concrète d'épreuves Zy, Zi, + + ., Zn au 
cours des essais indépendants est égale au produit des probabilités 
d'obtention des épreuves isolées. 

Le processus stochastique reçoit l’appellation de chaine marko- 
vienne si l’espace des états Z — {2, z1, . . ., zL} est le mème pour 
toutes les étapes et que la distribution des probabilités des épreuves 
à chaque étape ne dépende que des épreuves qui se sont réalisées 
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à l'étape précédente, de sorte que 
P (Zn+i =2| To -.., Zn) = P (Zn+1 = 2[Tn). (5-106) 


Il est plus commode d'introduire pour les probabilités de la forme 
(5-106) des notations quelque peu différentes. Supposons qu’à 
la n-ième étape le système ait pris l’état z; € Z. Alors la distribution 
des probabilités (5-106) définira la probabilité pour que le système 
se trouve à la (n + 1)-ième étape dans l’état z; € Z. Dans le cas général, 
cette probabilité dépend de l'indice de l’étape et peut être désignée 
par Pi; (n). De cette façon, les probabilités 


Pu(n)= p (Zn =2)| In = 3) (5-107) 
vérifiant la condition 
L 


put) >0,  Ÿ pur) =1 (5-108) 
J 


sont les probabilités de passage à la n-ieme étape de l’état z; à 
l'état z;. 

Dans le cas où les probabilités de passage p;; (7) dépendent de 
l'indice de la n-ième étape, la chaîne markovienne est dite non 
homogène. Or ce sont les chaînes markoviennes homogènes qui jouent 
un rôle très important dans différentes applications ; dans ces chaînes 
les probabilités de passage restent les mêmes pour toute étape et 
peuvent être désignées simplement par p;;. 


b) Processus d’essais indépendants à deux épreuves. 
Distribution binomiale des probabilités 


Considérons de façon plus approfondie les cas où, dans un proces- 
sus d’essais indépendants, il n’y a que deux épreuves pour chaque es- 
sai qui nous intéressent, à savoir : un certain événement S se produi- 
ra-t-il ou ne se produira-t-il pas à la suite de cet essai? Une des 
épreuves sera appelée cas favorable ou succès, et l’autre, cas défavo- 
rable ou insuccès. 

Désignons par p la probabilité du succès d’un essai isolé, et par 
q = 1 — p, la probabilité de l’insuccès. Proposons-nous de recher- 
cher la probabilité w (r, nr, p) d’avoir r succès au cours de nr essais. 

Pour plus de commodité, désignons le succès par 1 et l'insucces 
par 0. Alors à la réalisation de r succès au cours de n essais corres- 
pondra une suite de nr épreuves constituée de r unités et de rz —7r 
zéros. Du moment que les épreuves isolées sont indépendantes, la 
probabilité de cette suite, égale au produit des probabilités des 
épreuves isolées, aura pour expression 

"a. (5-109) 

Le nombre total des différentes suites de nr éléments contenant 

r unités est égal au nombre des combinaisons de nr éléments r à r, 


452 CH. 5. ASPECTS ENSEMBLISTES DE LA THÉORIE DES PROBABILITÉS 


c.-àa-d. 


jet (5-110) 
ri ri(n—-r)!l° 
Puisque ces suites sont toutes incompatibles (la réalisation de 
l’une d’elles rend impossible la réalisation de toute autre), la proba- 
bilité d'apparition de l’une quelconque d’entre elles sera égale à 


w(r,n, p)= " pq. (5-111) 


Il est facile de vérifier que la probabilité totale de réalisation d’un 
nombre quelconque d’événements de 0 à » est égale à l'unité. 


w(r, 10, 2) 


0,300 
8266 


0,203 


0,088 
4107 2027... 200! 0,000 
[2 0,006 0,000 800 r 
——— _ - «4. - | D ES ES ER, QE TE 
0 1 2 3 4 5 6 7 8 39 10 


Fig. 5-7. Distribution binomiale 


La distribution des probabilités définie par (5-111) porte le nom 
de distribution binomiale. On se rend comte sans peine de la natu- 
re de la distribution binomiale en regardant à la figure 5-7 le gra- 
phique des ordonnées de cette distribution en fonction du nombre r 
HOT 10 et p = 1/5, c.-à-d. le graphique de distribution w (r, 

On s’attache très souvent à savoir la valeur de r telle que la dis- 
tribution binomiale passe par le maximum. Calculons d’abord le 
rapport entre deux ordonnées voisines de la distribution binomiale 


n nr 
con (rer  M=r+ir (5-112) 
w(r—1,n,p) ( n pr=ign=r#i rq . 
r— 1 


Ce rapport ne sera pas inférieur à l’unité tant qu'il y aurar < 
< (7 + 1) p. Par conséquent, la fonction w (r, n, p) passe par le 
maximum quand 


r=ent (n+1) p, (5-113) 
ent zx signifiant partie entière du nombre z. 


5-6. PROCESSUS STOCHASTIQUES DISCRETS 153 


La distribution binomiale a pour caractéristiques numériques 
sa moyenne v, et sa variance 0°, qui sont définies par les relations 


V}-=np;  O=npq. (5-114) 


c) Distribution de Poisson 


Il est extrêmement difficile de calculer les valeurs de w (r, n, 
p) quand 7 sont grands. Le calcul de ces probabilités se trouve ce- 
pendant grandement facilité par l'application de certaines métho- 
des approximatives, dont l’une consiste à substituer à la distribution 
binomiale la distribution de Poisson. 

Soit w (r, n, p) la distribution binomiale. On constate sans peine 
que la limite de cette distribution pour r — oc et p +0 et pour 
np = a = const, de sorte que p — a/n, est égale à 
lim w(r,n, n/a) = 2e 


no | 


(5-115) 


La distribution de la forme (5-115) se désigne par w (r, a) et 
s'appelle distribution de Poisson. On a donc 


Tea 
w(r, a) = 


TT (5-116} 

Une particularité caractéristique de la distribution de Poisson 
est que la moyenne et la variance de cette distribution sont les mé- 
mes et sont égales à a. 

La distribution de Poisson est une bonne approximation de la dis- 
tribution binomiale pour p petits. Ainsi, pour p 0,01 on peut 
remplacer le calcul de la distribution binomiale par le calcul de la 
distribution de Poisson en commençant par r = 10. 

Bien qu'obtenue comme cas limite de la distribution binomiale, 
la distribution de Poisson fait partie d’une classe indépendante des 
processus stochastiques, dite classe des phénomènes aléatoires 
rares. 

Considérons la suite d'événements S se succédant avec des inter- 
valles de temps aléatoires. Le nombre de tels événements se réali- 
sant dans un intervalle de durée + sera une variable aléatoire ayant 
pour moyenne Àt, où À est le nombre moyen d'événements à l'unité de 
temps. Proposons-nous de déterminer la probabilité de réalisation 
de r événements exactement dans l'intervalle +. 

Les événements S peuvent être considérés comme rares dans ce 
sens qu’on peut partager l'intervalle + en de brefs intervalles partiels 
de durée At dont chacun ne peut donner lieu qu’à la réalisation d'un 
seul événement S. Le nombre total de tels intervalles est rz — T/At 
et la probabilité pour que l'événement se réalise dans l’un des in- 
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tervalles Atest p — At/n, de sorte que r2p — Àt. Admettant que 
l'événement S se réalise dans chacun des intervalles At sans liaison 
avec sa réalisation ou non-réalisation dans d’autres intervalles, on 
aboutit à un processus d'essais indépendants caractérisé par la dis- 
tribution des probabilités w (r, n, p), où np —= À. 

Or, l'hypothèse de l'unicité de l'événement $ sur l'intervalle 
AT ne se justifie que lorsque la durée de cet intervalle est extrême- 
ment courte, c.-à-d. à la limite, quand At —0. Puisqu’on a à ce 
moment 2 — oo et p +0, avec rp = Àt — const, on conçoit que 
la classe des phénomènes rares obéit à la loi de Poisson avec la dis- 
tribution des probabilités 
are si 


w (r, ÀT) = (59-117) 


d) Distribution exponentielle. Notion de fiabilité 


Dans de nombreux problèmes, on s'attache à savoir la distribu- 
tion de probabilité pour les intervalles de temps entre les événements 
aléatoires dans le processus d'essais indépendants. De la formule 
(5-117), pour r = 0 et r = 1, on tire: 

et, probabilité pour qu'aucun événement ne se réalise dans l’in- 
tervalle de durée +: 

Ate-T, probabilité pour qu'il se réalise exactement un événe- 
ment dans l'intervalle de durée t. 

La probabilité pour qu'il se réalise plus d'un événement dans 
l'intervalle de durée + est égale à 


d— (ere) = 1 — {far EU GE _ | 


—acft-n+ 0... Nes... (65-4118) 


On voit que cette probabilité est proportionnelle à la quantité 
{At}, ce qui signifie que pour des Àt faibles la probabilité de réali- 
sation de deux ou plusieurs événements dans l'intervalle + est né- 
gligeable, tandis que la probabilité de réalisation d’un seul événe- 
ment dans cet intervalle est 


F(À,t)=1—e-", 1>0. (5-119) 


Au fond, l’expression (5-119) définit la probabilité pour que le 
temps pendant lequel un événement se produit ne soit pas supérieur 
à t. Pour obtenir la densité de cette probabilité, ou la probabilité 
pour que l'événement se produise à l'instant t, dérivons (5-119) par 
tapport à T: 


w(A,tT)—=Ahe-", +>0. (5-120) 
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La densité de probabilité pour + étant connue, on détermine aisé- 
ment le temps moyen pendant lequel aucun événement n'a lieu: 


moy = | ru (AT) dr = +. (5-121) 
0 


Les formules (5-119) et (5-120) définissent la distribution exponen- 
tielle, qui joue un rôle important en théorie de la fiabilité. 

Imaginons un dispositif formé d'un grand nombre d'éléments 
isolés, dont chacun peut tomber en panne avec le temps. Dans la 
plupart des cas les pannes des divers élé- 
ments se produisent sans liaisons entre elles, 44/t) 
et leur suite peut ètre considérée comme un 
processus d'événements indépendants, dans 
lequel À définit le nombre de pannes à 
l'unité de temps et s'appelle intensité des 
pannes, tandis que la quantité 1/À définit, È 
conformément à (5-121), le temps moyen de 
fonctionnement sans défaillance. la distribution du temps 

Pour caractériser la fiabilité d’un ap- de fonctionnement avant 
pareillage, on emploie habituellement la la première panne 
quantité h (t), dite risque de panne, qui 
exprime la densité de probabilité de la panne à l'instant + à condi- 
tion qu'aucune panne n'ait eu lieu jusque-là. 

Déterminons au préalable la quantité A(t)At qui fournit la 
probabilité pour que la panne se produise pendant l'intervalle Ar, 
sachant qu'aucune panne ne s’est manifestée pendant la période t 
précédente. D'après la formule de la probabilité conditionnelle 


Fig. 5-5. Cas typique de 


___ w(À, t) AT 
d'où l’on déduit 
À, 
k (t) —= RE . (5-123) 
Pour la distribution exponentielle, on a: 
Le” Àt 
h(T)=—— = À, (95-124) 


€ 


ce qui signifie que la fonction de risque est une constante égale à 
l'intensité des pannes. 

L'expérience d'utilisation de l’appareillage électronique enseigne 
que la courbe représentative de la fonction » (t) a l’allure de la figure 
5-8. La portion initiale de cette courbe accuse une intensité des pan- 
nes accrue due à ce que certains éléments possèdent des défauts cachés 
qui se manifestent pendant la période initiale de fonctionnement. 
À mesure que t devient élevé, l'intensité des pannes croît également, 
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ce qui est dû au « vieillissement » des éléments qui s'exprime par 
la dégradation de la qualité des éléments après un emploi prolongé. 
L'’intensité des pannes constante et, partant, la distribution expo- 
nentielle n’ont lieu que dans la portion moyenne de la courbe h (+). 

On arrive cependant à supprimer l'intensité des pannes accrue 
dans la période initiale en soumettant l’appareillage à un entraî- 
nement préliminaire avant la mise en service. D'autre part, la crois- 
sance ininterrompue des exigences envers la qualité de l’appareillage, 
résultant du progrès technique, fait que la qualité de l’appareillage 
cesse de satisfaire, à la longue, aux exigences nouvelles plus sévè- 
res. [Il se produit le vieillissement moral de l’appareillage, en géné- 
ral, avant que le vieillissement physique des éléments se fasse sentir. 
Cela permet d'admettre, dans bien des cas, que la fonction À (x) 
est constante et égale à À pendant toute la durée de service de l’appa- 
reillage, c.-à-d. d'apprécier la fiabilité en se basant sur la loi de dis- 
tribution exponentielle. 


e) Chaînes markoviennes 


Soit Z = {z,, . .., zL} l'espace des épreuves ou l’espace des 
états d’un certain système, qui reste le même pour toute étape du 
processus stochastique. Il est alors commode de désigner les états du 
système simplement par des indices affectant z en entendant par j 
l'état z; € Z. L'espace des états se représentera dans ce cas par l’en- 
semble des indices J = {1, ..., L}. 

Désignons par nn = (nt), ..., nl) la distribution des proba- 
bilités sur l’ensemble J pour la n-ième étape. À ce moment x£ 
définit la probabilité pour qu’à la z-ième étape le système soit dans 
l’état j. On a déjà indiqué que le processus stochastique est une chaîne 
markovienne homogène si les probabilités de transition du système 
Pijde l’état i à l’état j ne dépendent que de l’état i à l'étape précédente 
et sont les mêmes pour toute; étape. 

11 y a deux méthodes de représentation des probabilités de tran- 
sition. La première consiste à mettre les probabilités de transition 
sous forme d’un tableau appelé matrice de transition et noté P. 
Pour L = 3, cette matrice est de la forme 


Pis Pis Pi 
P—\| pes P22 Pas |- (95-125) 
P31 P32 Pas 


La condition (5-108) à laquelle doivent nécessairement satisfaire 
les probabilités de transition signifie que la somme des éléments dans 
chaque ligne de la matrice des transitions doit nécessairement être 
égale à l'unité. 
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La seconde méthode de représentation des probabilités de tran- 
sition consiste à construire le diagramme de transition, dont on voit 
sur la figure 5-9, a un exemple pour un système tristable. Le diagram- 
me des transitions représente un graphe dont les sommets correspon- 
dent aux états du système et les arcs orientés indiquent les transitions 
possibles d’un état à un autre. Les probabilités des transitions s’ex- 
priment par des nombres associés à chaque arc. Conformément à la 


a) 


Fig. 5-9. Diagrammes des transitions pour une chaîne markovienne 


condition (5-108), la somme des probabilités pour les arcs incidents 
vers l’extérieur à tout sommet du graphe doit être égale à l'unité. 

Nombre de processus dans diverses branches de 13 science et de 
la technique peuvent être réduits aux chaînes markoviennes. En 
sociologie, les chaînes markoviennes facilitent l’étude des problèmes 
de variation de la structure sociale ou professionnelle de la po- 
pulation, des problèmes de migration de la population, etc. En biolo- 
gie on étudie à l’aide des chaînes markoviennes le caractère d’évo- 
lution des diverses espèces d'animaux et de plantes. En physique, 
les chaînes markoviennes servent à l'étude de la diffusion de gaz. 
En technique, on se sert des chaînes markoviennes pour décrire cer- 
tains processus de transmission de messages, différents processus 
de production, certains processus de contrôle de l’état d'utilisation 
et de recherche de défauts dans des dispositifs techniques complexes, 
et ainsi de suite. 


Exemple 5-9. L'usine produit des téléviseurs d'une marque déterminée. 
Suivant que le type de téléviseur en question jouit ou non de la demande auprès 
des consommateurs, l’usine peut se trouver, à la fin de l’année, dans l'un des 
deux états: 1,la demande existe; 2, il n’y a pas de demande. La demande 
varie avec le temps, de sorte qu’on a la probabilité de 4/5 pour que vers la fin 
de l’année l'usine reste dans l’état 1. D'autre part, si l’usine s’est trouvée dans 
l’état 2, on prend des mesures en vue de modifier et de perfectionner le modele, 
de sorte que vers la fin de l’année suivante l’usine passera à l’état 1 avec la 
probabilité de 3/5. 
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Dans l’exemple proposé, le développement de la production est représenté 
par une chaîne markovicenne avec la matrice des transitions 


1 


P— 
2 


5 
Le diagramme des transitions est donné sur la figure 5-9,b. 


enfeo en 


Quand on étudie des chaînes markoviennes, on s’attache avant 
tout à savoir la variation de la distribution des probabilités des 
états n, lorsque le système passe d’un état à un autre. Désignons par 
T l'événement consistant en ce que le système se trouve à la 
(nr + 1)-ième étape dans l’état j. 

Dans les notations adoptées, la probabilité de cet événement sera 
P (T) = nÿ),. Désignons par S; l’événement consistant en ce que le 
système prenne l’état à à la n-ième étape, de sorte que P (S;) — nt). 
La grandeur p;; est alors la probabilité pour que le système se trouve 
à la (r + 1)-ième étape dans l’état j si à la z-ième étape il a été dans 
l'état i, c.-à-d. p;5 = P (T]|S;). D'après la formule de la probabilité 
totale (5-42), on trouve: 

L 
ant = 2 Opus, j=A,...,L. (5-126) 
1— 

La formule (5-126) permet de déterminer successivement, étape 
après étape, la variation de la distribution des probabilités des états 
du système si la distribution initiale des probabilités est connue. 


Exemple 5-10. Supposons que l'usine (exemple 5-9) se trouve à l'instant 
initial dans l’état 1, c.-à-d. la distribution initiale des probabilités a la forme 
To = (1, 0). Utilisant la formule (5-126) et la matrice des transitions, on a pour 
la première étape: 


4 3 
740 = 78 pas + 08 pas = +0 O8 ; 


9 = 040 pre + nf) pae = 1e +0. += 0,2, 


Pour la deuxième étape 
a —0,76,  x£2— 0,24. 


Poursuivant ces calculs, on obtient la variation successive de la distribu- 
tion des probabilités définie par le tableau 5-1 pour l’état initial (1, 0). On voit 
de ce tableau qu’à mesure que n croît, x? tend vers 0,75. et x{??, vers 0,25. 

Si l’état initial du système cest l’état 2, de sorte que x, = (0, 1), la distri- 
bution des probabilités aux étapes successives aura la forme donnée par le ta- 
bleau 5-1. Dans ce cas, avec l'accroissement de », les grandeurs 74? et 1%? tendent 
vers les mêmes valeurs 0,75 et 0,25 qu'avec la distribution initiale x, -= (1, 0). 
On voit donc que dans la chaîne markovienne donnée les probabilités des transi- 


tions après un grand nombre d’étapes parcourues deviennent indépendantes de 
l’état initial du système. 
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Tableau 5-1 
Variation de la distribution des probabilités 
des états du processus markovien 
Etat initial x -- (1,0) 
ñn 

el 'lrlr ll". 
(1) | 1 | 0,8 | 0,76 | 0,752 | 0,7504 015008 | 
a(2) | 1 | 0,2 | 0,24 | 0.2 | 08 0 ,24992 


EE = —— © —— 


Etat initial x%o - (0,1) 


S'il existe, pour une chaîne markovienne, une distribution limite 
des probabilités correspondant à r — oo et indépendante de l’état 
initial du système, cette distribution définit le régime limite ou 
établi du système. On dit alors que le système est statiquement stable, 
et le processus markovien se produisant dans ce système est dit 
ergodique. 

Désignons par x = (nt, ..., n(£l)) la distribution établie des 
probabilités dans la chaîne markovienne ergodique. Les composan- 
tes 10) de cette distribution peuvent être déduites des équations 
(5-126), qui deviennent pour 7 —- co: 


L 
nD= D np, j=1,...,L. (5-127} 
ii 
Or, les L équations (5-127) ne sont pas toutes linéairement indé- 
pendantes, car les probabilités r0) sont liées entre elles par la 
relation 
L 
Ÿ r0=1. (5-128) 
ji 
Aussi, pour déterminer L composantes inconnues nr) de la distri- 
bution des probabilités x, suffit-il de prendre ZL — 1 équations quel- 


conques (59-127) et de les résoudre conjointement avec l’équation 
(5-128). 
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Eremple 5-11.Pour la matrice des transitions de l'exemple 5-9, la première 
des équations (5-127) a la forme: 


a = nt) past 2) pos = 1) ++ x(2). 


L'équation (5-128) donne: 
nt) + nt = 1. 
Résolvant ces deux équations ensemble, on trouve: 
a) = 0,75; xt?) = 0,25. 


Le processus de passage d’une chaîne markovienne ergodique 
de l’état initial au régime établi porte le nom de processus transitoire. 
Le processus transitoire se décrit par la suite des distributions des 
probabilités x, pour r = 1, 2, ...; la distribution initiale des 
probabilités x, étant connue, on construit ce processus par applica- 
tion successive de la formule (5-126), comme on l’a fait dans l’exem- 
ple 5-8. On peut aussi faire autrement. 


Introduisons les quantités pl définissant la probabilité de passa- 
ge du système de l'état à à l’état j au cours de / étapes: 


DO = pan = an = à) Im=0, 1 (5129) 


Connaissant les probabilités p5 } on arrive à rechercher la distri- 
bution des probabilités x, d’après la distribution x, par application 
d’une formule analogue à (5-126): 


L 
[a — D no”pt?, j = 1,' . L. (5-130) 
i=1 

Pour déterminer la liaison des probabilités de transition p{? 
avec les probabilités p;;,'posons Z! = /, + !, et considérons le passage 
du système de l’état x, à l’état x, en deux stades: passage de x 
à T1, puis passage de x%y, à 37 = T1, On a alors 


L 
pe 5 app. (5134) 
où : 
L 
nf — — à nf) pa . (5-132) 


ll 


Substituant la valeur de n{° dans (5-131), on obtient : 


L 
a® — D ph? D ap qu) => ch D php Ga (5-133) 


Comparons 6133 avec (5-130) ; il vient: 


L 
pirtl) à pape? (5-134) 
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Pour le calcul successif des probabilités de transition p®, pf.. 


il est commode de poser dans (5-134) L, — { — 1, L, — 4. Îl vient 
alors : 


( 


1) (1-1) 
pi = À Pi 


Pir Pi: (5-135) 


TLAe 


Posant successivement ! = 1, 2, ... et se rappelant que par 
définition des probabilités de transition p;}, 


0 1 ik 5136 
Pik — O, ik, ( 7 ) 
on trouve: 
L 
p$} —= Dijs ÿ= à DPihPhjs -.. (59-137) 


L'expression (5-135) peut être généralisée au cas d’une chaîne 
markovienne non homogène, dans laquelle les probabilités de tran- 
sition dépendent de l'indice de l'étape. Dans ce cas on entend par 
probabilité p;; (n, n,) pour r << nr, la probabilité pour qu’à l’étape 
n, le système se trouve dans l’état j si à l'étape n ilétait dans l’état i: 


Pin, r)=p(rn=jlzn=i), n<h. (5-138) 
Par analogie avec (5-130), on a alors: 


L 
= Dm pu(rm), RC (5-139) 
1: =: 
D'autre part, considérant un certain rx’ vérifiant la condition 
n<n <<, on arrive à mettre a sous la forme 


L L L 
] ©) kR ’ . 
= — i— 
L x L 
= À nn D pan (r, n°) pas(n', m1). (5-140) 
2—= = 


Par comparaison de (5-139) avec (5-140), on constate que 


L 
pus, r)= À pan (n, n°) pas(n', n) (5-141) 


pour tout nr << n° << n,. La relation (5-141) porte le nom d'’équation 
de Chapman-Kolmogorov. 


11—0732 
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5-7. ELEMENTS DE STATISTIQUE MATHÉMATIQUE 
a) Objet de la statistique mathématique 


L'évolution de la science et de la technique exige la pénétration 
de plus en plus profonde dans l'essence des phénomènes de la nature. 
Or ces phénomènes eux-mêmes se présentent à nos yeux sous la forme 
d’une multitude de faits et observations très variés, qui résultent 
à leur tour de l’action de très nombreux facteurs; une partie de ces 
facteurs sont réellement la cause du phénomène en question, tandis 
que d’autres, auxiliaires et insignifiants, ne font souvent que voiler 
le contenu? du phénomène. De grandes connaissances théoriques et 
pratiques sont nécessaires pour éliminer toute l'information secon- 
daire et mettre en valeur les éléments fondamentaux et essentiels 
dispersés dans les observations. 

Utilisant les méthodes de la statistique mathématique, on arrive 
à mettre la multitude des résultats de l'observation sous une forme 
compacte, se prêtant à l'étude. Ces méthodes permettent de tirer 
l'information essentielle de l’ensemble des observations en la ré- 
sumant dans quelques paramètres généralisés. S'il se trouve que les 
données collectées ne suffisent pas pour aller au fond du phénomène 
et qu’une expérience supplémentaire s'impose, il y a des méthodes 
statistiques par lesquelles on arrive à effectuer cette expérience de 
façon optimale, de sorte que le travail du chercheur soit facilité au 
maximum tant à la réalisation de l’expérience qu’au dépouillement 
de ses résultats. 

On conclut de ce qui précède que la statistique mathématique est 
la science des méthodes de dépouillement d’une grande quantité 
de données expérimentales visant à en dégager des conclusions cor- 
rectes. 

I1 est impossible d'examiner dans ce chapitre tous les problèmes 
relevant des méthodes de la statistique mathématique; nombre de 
manuels et de monographies [35 à 38] y sont consacrés. Aussi se borne- 
ra-t-on à considérer les méthodes les plus employées de résolution de 
problèmes statistiques. Quelques-unes de ces méthodes seront déve- 
loppées au chapitre 9 sous l’optique de la théorie de la prise de déci- 
sions. 


b) Notion d’échantillon aléatoire 


Soit x une variable aléatoire unidimensionnelle dont la fonction 

de répartition est F (x). Considérons une variable aléatoire à 7 di- 
mensions 

(xt), ...,2{n)) 5-142) 

telle que ses différentes composantes soient des variables aleatoires 

indépendantes ayant les mêmes fonctions de répartition F (x). 

Une telle variable multidimensionnelle aura pour fonction de ré- 
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partition le produit de celles de ses composantes 
n 
[LL Fa). (5-143) 
i=1 


Il est commode de considérer les variables aléatoires xt comme 
des épreuves, ou résultats d’une certaine expérience. Dans ce cas la 
variable aléatoire multidimensionnelle (5-142) peut être assimilée 
ou bien au résultat de x expériences indépendantes effectuées suc- 
cessivement sur le même matériel ou bien au résultat de n expérien- 
ces effectuées simultanément sur r matériels de même type. 

Etant donné qu'on peut toujours — du moins en théorie — 
faire un nombre infini d'expériences, il s’agit, au fond, d’une collec- 
tion infinie de variables aléatoires z{) dont la fonction de répartition 
est F (x). Une telle collection infinie porte le nom de population infji- 
nie à fonction de répartition F (x). 

Chaque épreuve concrète, c.-à-d. chaque ti) faisant partie de la 
collection finie (5-142), peut être considérée comme le choix d’un 
nombre sur une population infinie. La collection (5-142) tout entière 


représente la suite de nr choix de cette espèce et s'appelle échantillon 
aléatoire. 


c) T'héorèmes limites de la théorie des probabilités 


En statistique mathématique, on accorde un grand intérêt à l’é- 
tude de la variation des propriétés de l'échantillon aléatoire avec 
l'augmentation de sa taille et, plus particulièrement, aux relations 
limites qu’on obtient quand 7 —+ co. Dans cette étude, le rôle primor- 
dial revient à l'inégalité de Tchébychev, à la loi des grands nombres 
qui découle de cette dernière et au théorème limite central. 

Si x est une variable aléatoire d'espérance mathématique v et 
de variance 0”, elle vérifie l'inégalité; suivante dite inégalité de 
Tchébychev : 


P(|z—v|>h0) <<. (5-144) 


Pour démontrer cette inégalité, partageons l'axe réel en trois 
intervalles : 
I — (— ©, v — Ac]; I = (v — Ào, v + Ao); 
— [v + 0, + oo). 


La variance de x peut s’écrire comme 


+ oo 
OC? — | (z— v}* w (x) dx — | (x — v}* w (x) dx + 
“oo I 


+ [eee (ao dr + À (x veu (2) dx. 
É I” 
11° 
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Supprimant dans l'expression de 0° le terme répondant à l’inter- 
valle 7”, on a: 


< | (x — v}° w (x) dx + | (zx — v}° w (x) dr. 
I I” 


Lai 


Comme dans l'intervalle Z on a x — v << — Ào, et dans l’in- 
tervalle Z” x — v > Ào, l'inégalité ne sera que plus forte si l’on 
remplace dans les deux intégrales (r— v)* par À*0*. De cette façon, 
Lo (P (zx << v — Ào) + P (x > v +io)] — 

= 0*P (1x — v|> Ào), 
ce qui équivaut à (5-144). 

L'inégalité (53-144) définit la probabilité pour que la’ grandeur 
x — v dépasse les limites de l'intervalle (—Ao, + Ào). Or,on peut 
aussi déterminer la probabilité pour que zx — v reste dans les limites 
de l’invervalle indiqué ; cette probabilité est 

P(Iz—v|<2io) = 1—P (Iz—v]> A0), 
ou, compte tenu de (5-144), 
P(|z—v|<h0)>1—.. (5-145) 

Désignons Ào par e. L'inégalité devient 


P(Iz—vl<9>1-<. (5-146) 
Revenons à l'échantillon aléatoire (x,, . .., x,) de taille n. 


Désignons par zx la moyenne arithmétique de cet échantillon qui est 
égale à 


z=— Ÿ si. (5-147) 
Afin de simplifier l’écriture, nous adopterons dans la suite la no- 


tation S ou S, pour désigner la sommation sur toutes les données 
d’échantillonnage. La relation (5-147) s’écrira alors 


z=LSs (=. (5-148) 
Conformément à (5-85) et à ED la variance de x est 


D (x) — pe œ 21-- SD (x)] = (5-149) 


Remplaçant dans (5-146) zx par x et, partant, 0? par 0°/n, on 
obtient : 


p{lin-v<elp1-Z+, (5-150) 


E. 
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où v est l'espérance mathématique de x, qui est une valeur moyenne 
pour la population infinie soumise à l’échantillonnage. 
On voit de (5-150) que pour nr —+ © et pour tout & > Ù 


p { —v|<e} + 1; (5-151) 


c’est la loi des grands nombres. Il en découle que, pour des rx grands, 
on a la probabilité aussi proche de l'unité que l’on veut pour que 
la moyenne arithmétique et l’espérance mathématique v — M (x) 
d’une variable x se confondent. 

Citons sans démonstration une des plus fondamentales relations 
limites de la théorie des probabilités : c’est le fhéorème limite central. 
Soit (z1,, - . ., z,) une suite de variables aléatoires qui ont, en géné- 
ral, les fonctions de répartition F;, (x), ..., F, (x), les moyennes 
Vis + + + Vn €t les variances 6°, . .., 0 différentes. Adoptons les 
notations 


— Î 1 2 1 a = = 
T=—S(x); v=—S(v),; s=—S (0). (53-152) 


S n 
n 


Le théorème limite central stipule que si les variables aléatoires 
Lis + - + Zn Sont indépendantes et ont des variances finies de même 
ordre, leur moyenne arithmétique x tend (quand le nombre de ter- 
mes est grand) vers la distribution normale caractérisée par la moyen- 
ne v et la variance s. Remarquant que la variable 


r—v _ 
dt — ———— 2-193 
aura alors la moyenne égale à zéro et la variance égale à l'unité, 
on peut affirmer en se basant sur le théorème limite central que pour 


n — oo l’on aura 
1 


si 


— 


T—V 
——— — 
P ss Vn < y) 

Les problèmes dans lesquels la variable aléatoire étudiée repré- 
sente la somme d’un grand nombre de variables aléatoires indépen- 
dantes sont très fréquents. C’est ainsi que l'erreur d’un instrument 
compliqué est le résultat de l'addition de différentes sollicitations 
extérieures et d'erreurs fournies par les éléments isolés de l’instru- 
ment en question. Dans ce cas les erreurs dont l'influence est notable 
sont faciles à éliminer. 

Si une coupure se produit dans un circuit électrique, elle est faci- 
le à localiser et à éliminer. Par contre, il est difficile de mettre au 
clair les causes des erreurs de faible grandeur. Donc, considérant les 
composantes isolées de l’erreur totale comme uniformément petites, 
on peut affirmer, sur la base du théorème limite central, que la 
distribution de l'erreur totale est proche de la distribution normale. 


du. (5-154) 
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d) Problèmes de la statistique mathématique 


Le problème fondamental de la statistique mathématique est la 
recherche des paramètres inconnus de la distribution d’une popula- 
tion infinie d'après un échantillon fini connu. On peut chercher alors 
tant la fonction de répartition F (x) elle-même que des paramètres 
isolés de celle-ci tels que la moyenne, la variance, la plus grande ou 
la plus petite valeur de la variable aléatoire, etc. 

Les éléments de l'échantillon fini étant des variables aléatoires, 
la valeur du paramètre recherchée d’après cet échantillon sera elle 
aussi une variable aléatoire. Plus particulièrement, disposant de 
plusieurs échantillons de même taille faits sur une seule. et même 
population infinie, on obtient autant de valeurs du paramètre en ques- 
tion! qu'il y a d'échantillons. Aussi l'échantillon fini ne permet-il 
pas de savoir avec exactitude la valeur du paramètre, mais seule- 
ment d'en faire une estimation plus ou moins précise. Les valeurs 
numériques des différents paramètres tirées d'un échantillon fini 
portent le nom d'’estimateurs des paramètres de la population infinie. 

Dans le cas général, on peut tirer des estimateurs différents d'un 
seul et même échantillon. Soit, par exemple, un échantillon {z;, 
Les ++. In} tel que LL LL... LI, ; on demande de savoir 
l’estimateur de la moyenne. Conformément aux formules (3-24), 
(3-25) et (3-27), la moyenne admet plusieurs estimateurs. Ce sont: 

la moyenne de toutes les observations, ou médiane : 


Tn+i pour 7 impair ; 
2 72. 
TZ = | . (5-155) 
 \x +Tn pour n pair; 
2 F1 m4) 
la demi-somme de la plus petite et de la plus grande valeur 
= | : 
z=r(xi+ 2); (5-156) 
la moyenne arithmétique de toutes les observations 
n 
= 1 
z=— > Ti. (5-157) 


1-1 


Lequel de ces estimateurs est-il à préférer? La réponse à cette 
question est donnée en introduisant certains critères qui doivent 
être remplis par l’estimateur. Considérons-en les plus importants. 

4. L'estimateur doit être sans biais, c.-à-d. exempt d'erreur sys- 
tématique susceptible de faire surestimer ou sous-estimer la valeur 
du paramètre dans tous les échantillons. Cela signifie que l'espéran- 
ce mathématique de l’estimateur doit être égale à la valeur réelle 
du paramètre. Désignant la valeur réelle du paramètre par & et son 
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estimateur par &, on exprime l'absence de biais en écrivant 
M (a&)= a. (5-158) 


2. L’estimateur doit être consistant, c.-à-d. qu'il doit tendre vers 
la valeur du paramètre &« à mesure que la taille de l'échantillon croît. 


L'estimateur & étant une variable aléatoire, cette tendance aura né- 


cessairement un Caractère probabiliste. Si l’on désigne par a, 
l’estimateur de & obtenu d’après un échantillon de taille n, l’estima- 
teur consistant doit vérifier la relation 


PIlan—a|<e] —+ 1 (5-159) 


pour r — oo et pour tout € >> 0. 

3. L’estimateur doit être efficace, c.-à-d. qu'il doit être le plus 
proche du paramètre à estimer que n'importe quel autre estimateur 
consistant et sans biais. En d’autres mots, il doit minimiser le nom- 
bre d'écarts excessifs à l’utilisation des différents échantillons. Ma- 
thématiquement, cela équivaut à l’exigence du minimum de la varian- 
ce de l’estimateur : 


D (x—a)= min. (5-160) 


e) Estimateurs sans biais de la moyenne et de la variance 


Soit (x, - .., Zn) un échantillon d’une population de moyenne 
v et de variance 0°. Désignons par x l’estimateur de la moyenne, et 
par s°, celui de la variance. 

Pour l’estimateur de v on prend généralement la moyenne arith- 
métique de l'échantillon, ou moyenne d'échantillon, 


2= LS = 6 (2). (5-161) 


En vertu de la loi des grands nombres, un tel estimateur est consis- 
tant, c.-à-d. il tend (converge en probabilité) vers v quand r —+ co. 
Puisqu'’elle représente la somme des variables aléatoires, la moyen- 
ne d'échantillon zx est elle-même une variable aléatoire, caracté- 
risée par une loi de distribution, une moyenne et une variance. 
La moyenne, ou l’espérance mathématique de la moyenne d'’é- 
chantillon, est égale à 


M = MIS{a)= SM (2)=v. (5-162) 


Nous voyons que l'espérance mathématique de la moyenne d'é- 
chantillon coïncide avec la valeur de v, ce qui témoigne de l'absence 
de biais de l’estimateur (5-161). Conformément à (5-149), la variance 
de la moyenne d’échantillon est o?/n. 
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Si l’échantillon est fait sur une population à distribution nor- 


male, alors x, en tant que somme de variables aléatoires à distribu- 
tion normale, aura aussi la distribution normale qui, compte tenu 
de (5-162) et de (5-149), aura la forme 


w(D=N(v, ©). (5-163) 


Dans bien des cas, il est commode de considérer non pas x mais 
la variable 


ayant la moyenne égale à zéro et la variance égale à l'unité; cette 
variable a la densité de probabilité N (0, 1). 

Si l’échantillon est fait sur une population dont la distribution 
n’est pas normale, la loi de distribution de la moyenne d'’échantil- 
lon ne sera normale non plus; or, en vertu du théorème limite cen- 
tral, on peut admettre que pour les échantillons de grande taille 
cette loi est proche de la loi W (v, o*/n). 

Pour trouver l’estimateur sans biais de la variance s°, cherchons 
l'espérance mathématique de la variable S (rx — zx)*. Mettant cette 
variable sous la forme 


S(2— = S{(2— v) — (5e = 
= S(z—v—2(x—v)S(z—v)+n(r—v)° 


et prenant l’espérance mathématique de chaque terme. on obtient : 


MIS (z—x)°?] = (n —1) 0° (5-165) 

ou 
S — JL)" 9 | 
M[ = 2 ER | = 0. (5-166) 


Il découle de (5-166) que l’estimateur sans biais de la variance 
est un estimateur de la forme 


D 1 e 1 
= —— (5-167) 


Avant de définir la loi de distribution de l’estimateur de la va- 
riance, considérons une loi de distribution très importante. Si y; 
sont des variables aléatoires indépendantes obéissant à la distribu- 
tion normale NV (0, 1), la variable aléatoire 


= À y (5-168) 


a la distribution #° avec nr degrés de liberté, le nombre n étant dé- 
terminé par le nombre de variables aléatoires indépendantes formant 
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la somme (5-168). Il existe pour la distribution %° des tables très 
détaillées, dans lesquelles on fournit pour différents r les valeurs de 
la probabilité p (4*—%xi), où %3 est un nombre positif quelconque. 

Par exemple, le tableau 5-2 donne les valeurs de 45 vérifiant la 
condition p (4*—%;) = 0,95 pour des r de 1 à 30. On trouve dans 
[36] des tables plus détaillées de la distribution %i. 


Tableau 5-2 


Valeurs de la borne supérieure de 95°, de %° pour la distribution Y° 
en fonction du nombre n de degrés de liberté 


ni 1112/31/14 1516|718|9/|1olu11l12/13/121|1:,5 
X9 04h27, 1 cv ras sl 04 5, 5,2] 5,9 . 1,3 
, lulu lue 20 nn 22 | 23 | 24 | 25 | 26 ur Le 29 0 
x | 8,0 | 8,7 | 9,4 Ho.10.0 11,6 a, ah3,10 14,6115,4116,2/16,9117,7118,5 


Il est facile de voir que si y; est la variable (x; —zx)/0 vérifiant 
les conditions imposées à y;, la grandeur 


o  (n—1)s° 


définira la loi de distribution de s. 


f) Estimation par le maximum de vraisemblance 


Bon nombre de problèmes de statistique mathématique se ré- 
duisent à estimer un certain paramètre & d'une distribution dont on 
connaît la forme. Le principe du maximum de vraisemblance consis- 
te à retenir en qualité d’estimateur du paramètre & la valeur qu’on 
juge la plus probable sur la base des données expérimentales. 

Soit un échantillon (z,, . .., +x,) de la population à densité de 
probabilité w (x, «) exprimée en fonction du paramètre &. La den- 
sité multidimensionnelle de probabilité pour cet échantillon 


L = Il W(x;, &) (5-170) 


porte le nom de fonction de vraisemblance. Conformément au principe 
du maximum de vraisemblance, on adopte comme estimateur de & 
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la valeur & pour laquelle la fonction de vraisemblance Z, ou, ce qui 
revient au même, son logarithme In L, admet un maximum.” On 


détermine la valeur de & à partir de l'équation de vraisemblance 


ñn 
ôlnL =Y anw(zx;, &) _p 


ôœ a ûœ (5-171) 
qu'on réduit facilement à la forme 

C 1 ôw (z4, @) __ 

> W(z;, @) aa = 0. (5-172) 


Dans le cas où l'échantillon est fait sur une population à distri- 


bution normale {V (v, o*) définie par (5-54), les équations de vrai- 
semblance définissant les paramètres v et © ont la forme 


> (ti — v) = 


1=1 


(5-173) 
> [1— GE AT |= = 0. 
De la première équation on tire l’estimateur de v 
= 1 
V= — > = (5-174) 


qui coïncide avec l’estimateur consistant sans biais (59-161) obtenu 
auparavant. La seconde équation de vraisemblance, conjointement 
avec (5-174), donne l'estimateur de 0° 


= S'(r—7) (5-175) 


i=i 


qui a cependant un biais. Aussi emploie-t-on généralement, en pra- 
tique, l’estimateur sans biais (5-167). 

Etudions sur un exemple la recherche de l'estimateur par maxi- 
mum de vraisemblance pour une distribution exponentielle. 


Exemple 5-12.7 Pour déterminer la durée de vie moyenne de l’appareillage 
produit par la fabrique, on a rocédé à l'essai de nr échantillons d’appareillage 
au cours de £{ heures. Lors de l'essai m échantillons ont fonctionné sans défail- 
lance pendant toute la durée {, alors que nr — m échantillons sont tombes en 
panne aux instants Ti, . . ., Tn-m- Quel est l’estimateur le plus vraisemblable 
du temps moyen de fonctionnement sans pannes? 

Admettant que le temps pendant lequel il se produit une panne obéit à la 


loi exponentielle (5-120), de sorte que la grandeur w (4, t) = AeTÀT représente 
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la probabilité de la panne à l'instant + et la grandeur e7M, la probabilité de 
fonctionnement sans défaillance pendant la durée t,on obtient la fonction de 
vraisemblance sous la forme 


L=(e-At}m [I w (À, Ti). (3-176) 
1=1 


De l'équation (5-171) on tire alors: 


— mt + ÿ (= | = 0, (5-177) 
= 1 
d'où 
n-m 
R mi > Ti 
TO = = ——"— (5-178) 


On montre de façon analogue que l’estimateur le plus vraisemblable de la 
probabilité d’un événement pour un processus d'essais indépendants et la dis- 
tribution binomiale est égal à 

ñ z 


+, (5-179) 


où nr est le nombre d'essais et z le nombre de cas favorables. 

Si le processus aléatoire obéit à la distribution de Poisson et que r événe- 
ments soient contenus dans l'échantillon couvrant n intervalles, l’estimateur le 
plus vraisemblable du nombre moyen d'événements par intervalle est la grandeur 


= r 
ë=Z. (5-180) 


g) Estimation des paramètres 
par la méthode des intervalles de confiance 


Dans les paragraphes précédents on a étudié les méthodes four- 
nissant l’estimation du paramètre sous la forme d’un nombre, c.-à-d. 
d'un point de l’axe réel. Une telle estimation est dite ponctuelle. 
Or, puisque l’échantillon est aléatoire, il arrive souvent, surtout 
quand la taille de l'échantillon est petite, que l’estimation obtenue 
s'écarte pour beaucoup de la vraie valeur du paramètre. 

On obtient beaucoup plus d'information en indiquant l'intervalle 
dans lequel se situe, avec une probabilité proche de l'unité, la va- 
leur ‘du paramètre à estimer. Par exemple, si y est une quantité 
proche de l'unité, l'intervalle (&«;,, «.) dans lequel se trouve, avec 
la probabilité y, la valeur du paramètre inconnu «a 


P(a <a<@:) = 7 (5-181) 


porte le nom d'intervalle de confiance à y—100%. Pratiquement, on 
se contente souvent de rechercher l'intervalle de confiance à 95 % 


en posant y—0,95. Après avoir trouvé l’estimateur ponctuel a du pa- 
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ramètre et la densité de probabilité de cet estimateur, on tire les 
limites de l'intervalle de confiance de Ia relation 
2 
| u (&) da = +. (5-182) 
æ 
Dans certains cas, au lieu de l'intervalle de confiance bilatéral 
(&1, &+), on ne demande de savoir que la limite inférieure &; ou su- 
périeure &: du paramètre considéré &. Les intervalles définis par les 
relations 


P(a>œa;)="y et P(a<a.)—7 (5-183) 


sont dits intervalles de confiance unilatéraux à y—100%. On établit 
les limites &, et &. de ces intervalles par les expressions 


+ co +as 
| w(a)da=#y et | w (@) da = y. (5-184) 
œi 7% 


Supposons que l'échantillon de taille x ait été pris sur une popu- 
lation à distribution normale V (v, o*) avec v inconnu et la variance 
o? connue, de sorte que 4 = Vnr(r—"v)/o aura la distribution 
N (0, 1). Introduisons encore la notation y — 1—q. Dans ce cas 
l'intervalle de confiance à (1 — q)—100% se définira par la relation 


P(—u< MED <+u)1-g (65185 
ou 
P(z-t 7 <V<Ir+ty 7 )=1—9. (5-186) 
Compte tenu de (5-58), on écrit 
1—qg=0(t,)—-0 (—4,) = 20 (4), (5-187) 
en aboutissant à l'expression suivante de £,: 
D (ta) =+(41— 9). (5-188) 


Pour les intervalles de confiance unilatéraux (4, + oo) et (— co, 
&) la relation (5-187) s’écrira comme suit : 


1—q =D (t)—D(— 00) =+ + D (4), (5-189) 


les valeurs limites des intervalles de confiance unilatéraux étant 
définies par 


D(&)=+ (1 — 29). (5-190) 
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On voit donc que les valeurs limites d’un intervalle de confiance 
unilatéral à (1—g) —100 % sont égales aux valeurs limites d’un in- 
tervalle de confiance bilatéral à (1—q) —100 %. 

Posant q — 0,05 et consultant les tables de l'intégrale de pro- 
babilité, nous tirons des relations (5-188) et (5-190) les limites sui- 
vantes des intervalles de confiance bilatéraux et unilatéraux : 


t1=1,96, t,=1,64. (5-191) 


Ainsi donc, connaissant la moyenne d’échantillon x calculée 
pour l'échantillon de taille x sur une population à distribution nor- 
male avec la variance 0° connue, on peut affirmer avec une probabi- 
lité de 0,95 que la moyenne v de la population appartiendra à l’in- 
tervalle 


= o —  pgc 9 409 
ZI LT <v< rz +1,96 Pr (5-192) 
ou que 
_ ru 
_ = 5- 
V> r—1,64 Vs : (5-193) 
ou que 
— ./ O 
v< x +1,64 x: (5-194) 


Les valeurs obtenues de {, peuvent servir aussi à rechercher les 
intervalles de confiance pour la distribution binomiale w (x, n, p), 
car, pour 7 suffisamment grands, la distribution binomiale tend vers 
la distribution normale caractérisée par la moyenne v — np et la 
variance 0° — npq. Posant & — (x— np)/V rpq, on aboutit à la 
conclusion selon laquelle, après x réalisations d'un événement S 
au cours de 7 essais indépendants, on a la probabilité 0,95 pour que 
la valeur moyenne np soit comprise entre les limites suivantes: 


z—1,96 Vnpq < np < x + 1,96 V npq, (5-195) 
ou pour que … 
np > z—1,64 V npq, (5-196) 
ou pour que 


np < x +1,64 V npq, (5-197) 
la valeur de V pq étant calculée d'après la valeur la plus vraisem- 
blable de p — p — x/n comme 


Vnpa= y <%2.. (5-198) 


n 


Exemple 5-13. De la production de l'usine on a prélevé de façon aléatoire 
et essayé 100 articles dont 37 ont été signalés comme appartenant à la 2€ qualité. 
quel est le pourcentage de la 2€ qualité dans tout le volume de production de 
’usine ? 
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Dans le cas donné nr —100, z — 37, V/npq = 4,84. Alors 1,96 V/npq = 9,5, 
de sorte que x — 1,96 V/npq = 27,5, z + 1,96 V/npq —\46,5. 

De cette façon, il y a 5 chances sur 100 qu’on se trompe en faisant une des 
hypothèses suivantes qui disent que le nombre des articles de la 2€ qualité 

1) est compris entre 27,5 et 46,5 % de la totalité des articles; 

2) n’est pas inférieur à 29 % de la totalité des articles; 

3) n’est pas supérieur à 45 % de la totalité des articles. 


On a très souvent recours aux intervalles de confiance pour esti- 
mer la grandeur v pour une distribution normale si la variance 0° 
n'est pas connue. Dans ce cas on est amené à employer non pas 0° 
mais l’estimateur de la variance s. Or, la variable 


t — Vie (5-199) 


ne sera plus distribuée, à la différence de (5-164), suivant la loi nor- 
male. En réalité la variable f définie par (5-199) obéira à la loi de 
distribution de Student qui peut être définie de la façon suivante. 

Soient uw une variable aléatoire à distribution normale W (0, 1) 
et v une autre variable aléatoire à distribution 4°. Si w et v sont in- 
dépendantes, la variable aléatoire 


t = = = st (5-200) 


définit la distribution de Student dans laquelle le nombre k porte le 
nom de nombre de degrés de liberté. 
Définissant maintenant les variables 


u=VrE—Y) , PS Lt) Lu (5-201) 

[0] 0° 
on s'assure qu'en vertu de (5-164) et de (5-169) ces variables véri- 
fient les conditions définissant la distribution de Student et que la 
variable { déterminée d’après (5-200) coïncide avec la valeur fournie 
par (5-199) pour 4 — nr — 1. De cette façon, la variable aléatoire £ 
d'équation (5-199) sera distribuée suivant la loi de Student avec 
k = n — 1 degrés de liberté. 

Désignons par {,4 les limites de l'intervalle de confiance bilaté- 
ral à (1—gq)—100 % pour la distribution de Student à k degrés de 
liberté. On trouve des tables détaillées (par exemple dans [36]) de 
tx pour différents q et pour 4 variant de 1 à 30. Lorsque k >> 30, 
les valeurs de £,, coïncident pratiquement avec les valeurs de t, 
obtenues pour la distribution normale. On propose un exemple de 
table de cette espèce (tableau 5-3) fournissant les valeurs de {4 
pour q — 0,05 et 0,1. 
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Tableau 5-3 
Valeurs des limites de l’intervaile de confiance à (1 — q)=— 1000; 
en fonction’du nombre de degrés de liberté k pour la distribution de Student 


q 
| [sa srl 
1 


L: le 
0,05 Han | 4,30 | 3,18 | 2,18 | 2,57 | 2,49 | 2,36 | 2,31 | 2,62] 2,28 


0,10 | 6,31 | 2,92 2,5 | 2. 2,01 1.4 | 1,0 1,86 Lss|1,8| 1,78 


R 


q 
uw [is [is | 2 ue | 2 | 2 |: | « 


0,10 


| 24 
0,05 | 2,15 | 2,12 | 2,10 | 2,09 | 2,07 | 2,06 | 2,06 | 2,05 | 2,04 | 1,96 
1,76 | 1,79 | 1,73 | 1,72 | 1,72 


1,71 | 1,71 | 1,70 | 1,10 | 1,64 


On déduit les limites des intervalles de confiance unilatéraux 
ta d'après les valeurs de f,4 de la relation 


Ur — log. (5-202) 


Exemple 5-14. Afin de réduire l'influence des parasites dans le canal de 
communication, chaque résultat de mesure d’un paramètre v à bord d’un mis- 
sile est transmis au sol trois fois. Les résultats des mesures sont z, = 3,2; r, — 
= 2,9; zs — 3,1. On demande de définir l’intervalle de confiance bilateral 
à 95 % pour le paramètre v en admettant que les déformations subies par chaque 
valeur transmise sont réciproquement indépendantes et distribuées suivant la 
loi normale.D’après les données mesurées, on trouve: 


n=3, 2 5 (2)= 3,067: 
s— 1 S (z—z)2=0,0234. 


n—1 


On lit dans le tableau 5-3 pour qg = 0,05 et k = n — 1 = 2: 


tan — 4,30, de sorte que tas Vr = 0,377. 
Donc, on a la probabilité 0,95 pour que 2,69 << v < 3,44. 


h) Vérification des hypothèses statistiques. 
Notion de critère d’adéquation 


Soit Z l'espace des épreuves à éléments z € Z. Pour déterminer 
la probabilité p (z) d’une épreuve z, on procède à #7 expériences. Si 
l'épreuve z a eu lieu », fois, on estime la probabilité de cette épreu- 
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ve d’après le rapport n./r. Or, en réalité, le rapport n./n nous donne 
non pas la probabilité p (z) de l’épreuve z maïs sa fréquence gq (2), 
qui peut être sensiblement différente de la probabilité, surtout 
quand le nombre d'expériences n'est pas grand. La question se 
pose : à quel point est-il légitime d'estimer la distribution des pro- 
babilités des épreuves p (2) sur la base des fréquences gq (z) connues? 
Cependant, il n’est pas tout à fait correct de poser le problème de 
cette façon. 

En effet, si l’on obtient à la suite de l'expérience quelques nom- 
bres exprimant les fréquences des différentes épreuves liées à l’expé- 
rience q (z), il faut que la substitution à ces nombres d’autres nom- 
bres [notamment des probabilités p (z)] soit justifiée par quelque 
chose. Comment peut-on justifier le remplacement d’un nombre par 
un autre? 

Supposons qu’en jetant une pièce de monnaie dix fois on a amené 
sept fois pile. La fréquence de pile dans l'expérience donnée est 0,7. 
Est-il légitime de modifier cette grandeur et de prendre un autre 
nombre déterminé comme probabilité de pile? 

Si nous ne savons rien sur la pièce de monnaie, en particulier 
si nous ignorons qu'elle est symétrique ou non, nous n’avons aucune 
raison de modifier la valeur de la fréquence tirée de l'expérience. 
On peut cependant poser le problème autrement. On sait que si la 
pièce est symétrique, la probabilité de pile est 0,5. On veut voir si 
la pièce est bien symétrique; dans ce but on jette la pièce dix fois. 
On a sept fois pile. Cela veut-il dire que la pièce est symétrique? 

Le problème ainsi formulé est le problème de vérification de l’hy- 
pothèse. De pareils problèmes se posent quand on a la possibilité 
de formuler une certaine hypothèse (par exemple que la pièce de 
monnaie est symétrique) portant sur le caractère de la distribution ou 
sur la valeur des paramètres de la distribution d’une variable aléa- 
toire. Le but de l'expérience est de confirmer ou de rejeter l’hypo- 
thèse avancée. Les méthodes de la statistique mathématique permet- 
tent de donner la réponse à des questions comme celles-ci : 

1) le nouveau modèle d'appareil a-t-il les qualités supérieures 
a celles des appareils existants? 

2) la fiabilité du système ne sera-t-elle pas inférieure à celle re- 
quise ? 

3) la nouvelle méthode de cure sera-t-elle plus efficace que les 
méthodes existantes? etc. 

Pour savoir si l’hypothèse avancée doit être acceptée ou rejetée, 
il faut élaborer un critère d'adéquation de l'hypothèse vérifiée aux 
résultats de l’expérience. 

Supposons qu’on a des raisons de croire que la valeur d’un pa- 
ramètre & est égale à «, et qu’on veut le vérifier expérimentalement. 


Après avoir effectué l'expérience, on a reçu l’estimateur «& de ce pa- 
ramètre, qui, étant une variable aléatoire, ne coïncide générale- 
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ment pas avec la valeur «&,. Cependant l'écart Aa = & — «, de 


l'estimateur & de la valeur réelle &, ne doit pas être grand; si cet 
écart est excessif, on ne peut donc pas l'expliquer par des causes 
aléatoires et l’on est amené à conclure que l’hypothèse selon laquelle 
la valeur du paramètre est &, n’est pas confirmée et doit être rejetée. 
Ainsi donc, choisir le critère d’'adéquation consiste à désigner la va- 
leur critique de l'écart A«., de telle sorte que la probabilité de dé- 
passer cette valeur soit très petite. En qualité d'écart critique, on 
peut prendre les limites de l'intervalle de confiance à (1—q) - 100%. 
On a alors la probabilité g pour que l’écart observé dépasse la valeur 
critique, c.-à-d. pour qu'une hypothèse correcte soit rejetée à tort. 
La grandeur q, appelée niveau de signification statistique, doit être 
choisie en fonction des conséquences auxquelles peut aboutir le 
rejet d’une hypothèse correcte. Pratiquement, on admet dans la 
plupart des cas q — 0,05 en prenant donc pour critère d’adéquation 
l'intervalle de confiance de 95 %. Or, dans les cas où l’on risque 
d’avoir des ennuis sérieux en rejetant à tort l'hypothèse correcte, 
on adopte q = 0,01, et même quelquefois moins. 

Il est à noter que la méthode proposée, bien que permettant de 
réfuter avec une grande certitude les hypothèses fausses, ne peut ga- 
rantir que l'hypothèse est vraie. Aussi, en voyant la valeur hypo- 
thétique &, tomber dans les limites de l'intervalle de confiance, ne re- 
tiendra-t-on pas l'hypothèse comme démontrée mais seulement com- 
me conforme aux résultats de l’expérience. Pour savoir si l’hypothèse 
est correcte, on effectue des recherches spéciales. 


PROBLÈMES AU CHAPITRE 5 


5-1. Quels sont les événements S, et S,5 de l'exemple 5-1? 

5-2. Montrer que si l’espace des épreuves contient r éléments, il contient 2n 
événements différents. 

5-3. Les magasins d’une entreprise reçoivent des coupe-circuit provenant 
de deux usines dans le rapport 1 : 3. La première usine fournit 10 % de produits 
défectueux, la deuxième usine, 20 %. Appliquant la formule de la probabilité 
totale, chercher la probabilité pour qu’un coupc-circuit prélevé au hasard dans 
les magasins soit défectueux. 

5-4. Construire le graphique de la fonction de répartition du nombre des 
points obtenus en jetant deux dés à jouer de l'exemple 5-1. 

5-5. Chercher la probabilité pour que le temps d’attente du passager de 
l'exemple 5-5 ne soit pas supérieur à 3 mn. 

5-6. Pour savoir combien il y a de poissons dans un étang, on tire 1 000 pois- 
sons, on les marque et on les remet à l’eau. Quel est le nombre de poissons dans 
l’étang pour avoir la probabilité maximale de rencontrer 10 poissons marqués 
parmi les 150 poissons tirés à nouveau? 

5-7. Il s’agit de faire 100 biscuits aux raisins secs. Quelle est la quantité 
minimale de raisins secs qu’on doit mettre dans la pâte pour que la probabilité 
de n'avoir pas un seul raisin sec en aucun biscuit ne soit pas supérieure à 0,01 ? 
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DEUXIÈME PARTIE 


OPTIMISATION DES PROCESSUS 
DE COMMANDE 


CHAPITRE 6 


STRUCTURE ET DESCRIPTION MATHÉMATIQUE 
DES PROBLÈMES DE COMMANDE OPTIMALE 


f-1. TRAITS ESSENTIELS DU PROCESSUS DE COMMANDE 


a) Notion de commande 


Partout dans le monde ambiant (qu'il s'agisse de la nature, de la 
technique ou de la société humaine) on voit évoluer des processus 
dont le caractère dépend d’une foule de conditions accessoires et de 
nombreux facteurs. En changeant les conditions d'évolution de ces 
processus, l’homme peut faire varier leur caractère pour les adapter 
à ses objectifs. Cette intervention dans l'évolution naturelle d’un 
processus et le changement apporté à sa marche normale représentent 
l'essence de la commande. On peut donc dire que la commande repré- 
sente une organisation particulière de tel ou tel processus entreprise dans 
le but d'atteindre à coup sûr les objectifs fixés [39]. 

Pour mieux comprendre l'essence du processus de commande, 
examinons le cas d’un chien qui poursuit un lièvre. Pour attraper le 
lièvre, le chien doit organiser ses actions d’une certaine manière, 
donc il doit les commander. Il s'ensuit que le processus de poursuite 
est un processus de commande. 

Le début de la poursuite doit être précédé par l'apparition du lie- 
re, c.-à-d. par la création d'une situation qui engendre un but dé- 
terminé qu'il faut ou que l’on veut atteindre. Mais avant de se lan- 
cer à la poursuite du lièvre, le chien doit apprécier la situation qui 
s’est créée pour la confronter avec ses désirs et ses possibilités. L’ap- 
préciation de la situation aboutit à la prise d'une décision sur les 
actions à entreprendre: faut-il tächer d'attraper le lièvre, ou non 
(le lièvre peut se trouver à une distance tellement grande que la 
poursuite soit privée de sens, le chien peut être fatigué, etc.)? Ce 
n’est qu'après la prise de la décision de poursuivre le lièvre que le 
chien procède à l’organisation de son mouvement ayant pour but. 
d'attraper le lièvre en un temps minimal ou avec un minimum 
d'effort. 

L'exemple cité met en évidence quatre étapes qui caractérisent 
tout processus de commande: l'apparition du but, l'appréciation de 
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la situation, la prise de décision et l’exécution de la décision prise. 
On remarquera que l'étape de l’apparition du but précède le début 
du processus de commande et c’est pour cette raison qu'elle ne sera 
pas examinée. D'autre part, compte tenu du fait que, lors de la com- 
mande des processus complexes, l'appréciation de la situation est 
réalisée sur la base d’une information collectée et dûment traitée, 
on arrive aux trois étapes suivantes du processus de commande: 

1) collecte et traitement de l’information pour apprécier la situa- 
tion créée ; 

2) prise de décision sur les actions les plus rationnelles à entre- 
prendre ; 

3) exécution de la décision prise. 

Parfois, il faut prévoir une quatrième étape incluant le contrôle 
de l'exécution de la décision. 

Les différents types de problèmes de commande se distinguent 
justement par la méthode et par l'ordre d'exécution de ces opé- 
rations. 


b) Types de problèmes de commande 


11 y a un grand nombre de problèmes dont le mécanisme de collec- 
te de l'information et d'exécution de la décision prise est tellement 
bien mis au point qu’il ne faut absolument pas penser à ces opéra- 
tions lors de la réalisation dela commande. Dans ces problèmes, l’exa- 
men du processus de commande se réduit essentiellement à l’exa- 
men de la deuxième étape. Ces problèmes sont appelés problèmes de 
décision à une étape. 

Mais, dans la majorité des cas, une telle approche n’est qu’une 
idéalisation et une simplification du processus réel de commande. 
En réalité, toutes les étapes du processus de commande sont étroite- 
ment liées et l’étape de la prise de décision implique un examen plus 
ou moins détaillé des procédés possibles de réalisation de la décision 
prise. Ainsi, pour prendre la décision de renoncer à la poursuite du 
lièvre. il faut se convaincre de l’inutilité de celle-ci, mais pour ce 
faire, il faut analyser, ne serait-ce que d’une manière approchée, 
les modes de poursuite possibles. 

Parfois, dans des pareils cas, le processus de commande est deé- 
composé en plusieurs étapes consécutives, la décision prise à une 
étape quelconque étant fonction des résultats obtenus par suite de 
l'exécution de la décision prise à l'étape précédente. Ces problèmes 
sont appelés problèmes de décision à étapes multiples. En qualité 
d'exemple on peut citer le processus de commande d’une fusée lan- 
cée de la Terre à la Lune. Ici, on distingue les étapes suivantes: pla- 
cement de la fusée sur une orbite circumterrestre, organisation du 
mouvement de la fusée vers la Lune, transfert de la fusée sur une 
orbite circumlunaire, alunissage. 


12% 
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Dans cet exemple, les étapes isolées du processus de commande 
à étapes multiples ont été obtenues d'une façon bien naturelle. 
Mais dans beaucoup d'autres cas, la décomposition d’un processus 
de commande complexe en étapes distinctes avec mise en évidence de 
la commande de chacune de ces étapes constitue un problème bien 
ardu. Ainsi, au cours de la poursuite du lièvre, on a affaire à une 
situation qui varie sans cesse vu que le lièvre tâche d'échapper à la 
poursuite. Le chien doit apprécier continüment cette situation et 
prendre des décisions toujours nouvelles, conformément à la situa- 
tion qui change en permanence, sans attendre les résultats finals de 
l'exécution des décisions précédentes. Dans les problèmes de ce type, 
on a affaire à des processus de commande dynamiques continus. 

Ce qui vient d'être dit montre la complexité et la diversité des 
problèmes de commande. Mais on sous-estimerait les difficultés 
rencontrées lors de la résolution de ces problèmes si l’on ne tenait pas 
compte du fait que les processus de commande évoluent, en règle 
générale, dans un milieu ambiant complexe. L'évolution des pro- 
cessus de commande est influencée par différents facteurs extérieurs 
dont l’ensemble est souvent appelé état de la nature. Pour prendre 
une décision juste sur telle ou telle action, il faut estimer leurs ré- 
sultats, mais, pour y parvenir, il faut connaître le caractère de la 
situation dans laquelle ces actions sont entreprises. 

Toutefois, on peut considérer comme typiques les problèmes de 
commande où l'information dont on dispose est soit insuffisante pour 
permettre l'évaluation précise de la situation, soit dénaturée par des 
facteurs étrangers. Néanmoins, l'insuffisance de l'information ne 
nous dispense pas de prendre une décision. La particularité des 
problèmes de commande réside justement dans le fait que la déci- 
sion doit être obligatoirement prise mêmesi nous ne sommes pas en 
état d'évaluer avec précision les résultats auxquels aboutira la dé- 
cision prise. 

De cette façon, durant le processus de commande, il surgit le 
problème de décision dans les conditions où l'information sur la 
situation établie est soit insuffisante, soit dénaturée. Ce problème 
est dit problème de décision en présence d’indétermination. 


c) Notion de recherche opérationnelle 


Citons encore une classe spécifique de problèmes de commande 
liés à l’activité des grosses entreprises industrielles et qui peuvent 
être appelés problèmes d'organisation-gestion (40, 41]. 

Avant la révolution industrielle, la gestion d’une petite entreprise 
pouvait être assurée par une seule personne qui s’occupait des achats, 
de la planification et de la direction du travail, de l'écoulement des 
marchandises, de l’embauchage et du licenciement de personnel. 
L'envergure modeste de l’entreprise lui permettait de prendre des 
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décisions pratiques sans recourir aux méthodes scientifiques de ges- 
tion en s’appuyant seulement sur sesconnaissances, expérience et in- 
tuition. Si quelques-unes des décisions prises ne s’avéraient pas les 
meilleures, elles n’entraînaient pas de pertes considérables, ou bien 
pouvaient être vite corrigées. 

L’agrandissement des entreprises industrielles a rendu impossi- 
ble la concentration des fonctions administratives entre les mains 
d'une seule personne. On a vu apparaître les chefs des services de la 
fabrication, des ventes, financiers, du personnel, etc. La mécanisa- 
tion et l'automatisation de plus en plus poussées de la production 
ont déterminé la division ultérieure des fonctions administratives. 
Ainsi, les services de la fabrication se sont scindés en des groupes plus 
petits affectés à la résolution des problèmes concernant l'exploitation 
et l’entretien, le contrôle de la qualité, la planification, le ravitaille- 
ment, le stockage des produits finis. etc. 

Chaque subdivision spécialisée d'une grosse entreprise effectue 
une partie bien déterminée de l'activité globale, étant guidée par 
les objectifs communs de l’entreprise. Mais en même temps, chaque 
subdivision spécialisée a ses propres objectifs. Tous ces objectifs ne 
vont pas toujours d'accord, quelquefois étant même contradictoires. 
En qualité d'exemple on peut examiner le problème des réserves de 
l'entreprise. Une certaine subdivision peut être intéressée par l’aug- 
mentation importante de ses réserves aux entrepôts afin de s'assurer 
une production sans à-coups. Mais si la capacité des entrepôts est 
limitée, les réserves des autres subdivisions doivent, dans ce cas, 
être réduites. Il en résulte un problème de type organisation-gestion 
qui consiste dans l'élaboration de la stratégie des réserves la plus 
avantageuse pour l’entreprise tout entière. 

Lors de la résolution des pareils problèmes d’organisation-gestion, 
il faut faire preuve d’une compréhension subtile des objectifs des sub- 
divisions isolées pour réaliser une concordance qui évite les contra- 
dictions aussi bien entre ces subdivisions qu'entre ces dernières et 
l'entreprise tout entière. Compte tenu des dommages importants 
qu’une grosse entreprise peut subir par suite de la prise des décisions 
non meilleures, il est évident qu’on ne peut pas résoudre ces proble- 
mes en se basant exclusivement sur l'expérience personnelle et le 
bon sens, et qu’il faut recourir aux méthodes scientifiques. 

L'élaboration des méthodes scientifiques de résolution des pro- 
blèmes d'organisation-gestion fait l’objet d’une branche scientifique 
relativement jeune appelée recherche opérationnelle. Dans la termino- 
logie de cette branche scientifique, le mot opération signifie une cer- 
taine mesure d'organisation dont la réalisation consiste à atteindre 
un certain but bien déterminé, par exemple la réglementation des 
réserves entreposées. Pour cela, il faut formuler les conditions qui 
caractérisent la situation dans laquelle sera réalisée la mesure, en 
particulier, les réserves nécessaires et les restrictions imposées par la 
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capacité des entrepôts dans l'exemple examiné. Le but'de la recher- 
che opérationnelle consiste à trouver et à donner une argumentation 
scientifique des procédés de réalisation de la mesure, procédés qui, 
dans un certain sens, sont les plus avantageux. 

Üne particularité spécifique des problèmes d'’organisation-ges- 
tion consiste dans le fait que les conséquences de tel ou tel mode de 
résolution peuvent avoir des répercussions importantes sur le tra- 
vail de toute l’entreprise. C’est pourquoi la prise de la décision finale 
revient toujours à une personne responsable (administrateur) pour- 
vue de pouvoir, et sort des cadres de la recherche opérationnelle, 
qui n’a pour but que de munir cet administrateur de recommandations 
bien fondées sur la décision à prendre. 

De cette façon. la recherche opérationnelle représente une bran- 
che scientifique qui s’occupe de l'élaboration des méthodes d'analy- 
se des actions orientées vers un but déterminé (opérations) et de l’es- 
timation comparée objective des décisions possibles. Bien que la 
recherche opérationnelle représente une branche scientifique auto- 
nome, qui a vu le jour au cours de la Seconde guerre mondiale, 
donc, avant l'apparition de la cybernétique, et qui à l’époque avait 
pour but la résolution des problèmes de défense antiaérienne de la 
Grande Bretagne, elle fait souvent appel à la cyvbernétique pour ré- 
soudre certains problèmes. 


6-2. OPTIMISATION DU PROCESSUS DE COMMANDE 


a) Critère de qualité de la commande 


Dans ce qui suit, le problème de commande sera traité comme un 
problème mathématique, sans oublier qu’à la différence de beaucoup 
de problèmes mathématiques, il admet non pas une seule mais une 
multitude de solutions différentes [42]. Cela est conditionné par le 
fait que, dans les problèmes de commande, il y a d'habitude plusieurs 
procédés d'organisation de tel ou tel processus pour atteindre l’objec- 
tif fixé. Ainsi, lorsqu'il s’agit de la poursuite du lièvre, le chien peut 
organiser de façons différentes son mouvement, lors du lancement de 
la fusée vers la Lune, on peut choisir différentes trajectoires de 
vol. etc. C'est pourquoi le problème de commande pourrait être 
posé en tant que problème de recherche d’au moins un des pro- 
cédés possibles menant à l’objectif fixé. Toutefois, une telle position 
de la question n'est d'habitude pas suffisante. 

Si un problème quelconque admet plusieurs solutions, il surgit 
un problème supplémentaire visant à trouver parmi ces solutions 
celle qui est la meilleure d’un certain point de vue. On peut citer 
un grand nombre de problèmes de ce type. Ainsi, il y a beaucoup de 
procédés permettant de confectionner une boîte à partir d’une feuille 
de carton de dimensions données. Comme problème supplémentaire 
on peut se proposer l'obtention d’une boîte de capacité maximale. 
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D'une ville à une autre on peut voyager en empruntant différents 
moyens de transport (chemin de fer, avion, bateau, autobus, voiture 
automobile). Le problème supplémentaire consiste à choisir le moyen 
de transport le plus avantageux au point de vue temps de voyage, 
prix, confort, habitudes, etc. Une situation analogue se rencontre 
dans les problèmes de commande. 

Si l’objectif de la commande peut être atteint en suivant plusieurs 
procédés différents, on peut imposer au procédé de commande des 
exigences supplémentaires dont le degré de satisfaction peut motiver la 
préférence que l’on donne à un certain procédé par rapport aux autres. 

Souvent, la mise en œuvre du processus de commande est liée 
à la consommation de certaines ressources: temps, matières pre- 
mières, combustible, énergieélectrique. Donc, en choisissant le procédé 
de commande, il ne suffit pas de poser la question de l’atteinte de 
l'objectif, mais aussi celle des ressources engagées à cette fin. Dans 
ce cas, le problème de commande consiste à choisir dans l’ensemble 
des décisions, qui assurent l'atteinte de l'objectif, celle qui nécessite 
le minimum de ressources. 

Dans d’autres cas, la préférence que l’on donne à un procédé de 
commande par rapport aux autres peut être motivée par d'autres 
exigences imposées au système de commande: le coût de l'entretien, 
la fiabilité, le degré d'approche de l'état atteint par le système par 
rapport à l’état requis, le degré de certitude des connaissances con- 
cernant l’état de la nature, etc. 

L'expression mathématique de l’estimation quantitative du degré 
d’accomplissement des exigences imposées au procédé de commande 
est appelée critère de qualité de la commande. Le procédé de commande 
préféré ou procédé optimal sera celui pour lequel le critère de qualité 
de la commande atteindra son minimum (quelquefois son maximum). 
En choisissant, par exemple, le régime de vol, on peut prendre com- 
me critère de qualité de la commande soit l'expression de la quantité 
de combustible consommé par unité de chemin parcouru, soit le 
chemin parcouru par unité de combustible consommé. Au régime 
à économie maximale, c.-à-d. au régime optimal, va correspondre 
soit la valeur minimale (premier cas), soit la valeur maximale 
(deuxième cas) du critère de qualité de la commande. 

La définition de la commande optimale qui vient d'être donnée 
sera considérée comme préliminaire. Une définition plus rigoureuse 


sera donnée après l’examen des contraintes imposées au processus 
de commande. 


b) Contraintes imposées au processus de commande 


Le problème de commande optimale ou de commande en général 
ne se poserait pas si l’on n’imposait aucune contrainte au carac- 
tère d'évolution du système. Ainsiiln'y aurait pas de problème de 
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poursuite du lièvre si le chien pouvait parcourir en un clin d'œil 
la distance qui le sépare de son but. Il s'ensuit qu’en résolvant un 
problème de commande, on ne peut pas oublier que l’évolution de 
n'importe quel système est toujours liée à différentes contraintes. 

Pour mieux se représenter les contraintes qui peuvent se rencon- 
trer, examinons un exemple concret relatif à la conduite d’une voitu- 
re automobile. En réalisant la commande, le conducteur doit prendre 
en considération la puissance limitée de sa voiture, ce qui im- 
plique le transport d’une charge limitée sans dépassement d’une 
certaine vitesse limite. Grâce à l’inertie de la voiture, sa vitesse et 
sa direction de mouvement ne peuvent être changées qu’à une accé- 
lération limitée. Cela signifie que l’arrêt instantané et le changement 
instantané de direction sont exclus en cas d'apparition d’une situa- 
tion dangereuse imprévue, ce qui limite, à son tour, la vitesse de dé- 
placement. D'autre part, en choisissant son itinéraire,'le conducteur 
doit tenir compte de la réserve de combustible dont il dispose et du 
ravitaillement à effectuer en route, etc. 

Dans le cas général, il y a deux types de contraintes imposées 
au choix du procédé de commande {43]. Les contraintes du premier 
type sont constituées par les lois de la nature conformément auxquel- 
les s'effectue l’évolution du système commandé. Lors de la formula- 
tion mathématique du problème de commande, ces contraintes se 
présentent d'habitude sous la forme d'équations algébriques, diffé- 
rentielles ou aux différences de l’objet commandé qui sont souvent 
appelées équations des liaisons. Les contraintes du deuxième type 
sont déterminées par la limitation des ressources utilisées pendant 
la commande ou d’autres grandeurs qui, en vertu des particularités 
physiques de tel ou tel système, ne peuvent ou ne doivent pas sortir 
de certaines limites. Au point de vue mathématique, les contraintes 
de ce type sont d'habitude exprimées sous la forme de systèmes d’é- 
quations algébriques ou d'inégalités qui lient les variables décrivant 
l’état du système. 


c) Position du problème de commande optimale 


Un problème de commande peut être considéré comme formulé 
mathématiquement si: 

l'objectif de la commande, exprimé par le critère de qualité de 
la commande, est formule ; 

les contraintes du premier type, représentant un système d'’équa- 
tions différentielles ou aux différences qui limitent les modes possi- 
bles d'évolution du système, sont définies; 

les contraintes du deuxième type, représentant un système d'’é- 
quations algébriques ou d'inégalités qui traduisent la limitation 
des ressources ou d’autres grandeurs utilisées dans la commande, 
sont définies. 
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Le mode de commande, qui satisfait à toutes les contraintes impo- 
sées et qui rend minimal (maximal) le critère de qualité de la com- 
mande, est appelé commande optimale. 


6-3. DESCRIPTION MATHÉMATIQUE DE L'OBJET COMMANDÉ 


a) Structure de l’objet commandé 


Appelons l’objet commandé le système physique dont les proces- 
sus sont soumis à notre commande. Il y a une grande diversité d'ob- 
jets commandés dont la nature physique est très variée. Ainsi, on 
peut citer: 

dispositifs techniques: voiture automobile, avion, fusée, tour, 
processus technologique, etc. ; 

entreprises industrielles: section, atelier, usine, branche indus- 
trielle ; 

systèmes économiques : économie de l’entreprise, économie de la 
branche industrielle, économie de l'état; 

systèmes biologiques ; 

systèmes sociaux, etc. 

Vu que les lois qui régissent les processus de commande sont com- 
munes quelle que soit la nature physique des objets commandés, 
on peut examiner la structure générale du processus de commande 
et donner sa description mathématique. 

Désignons par z la variable qui définit l’état de l’objet comman- 
dé. Quelquefois, c'est une grandeur unidimensionnelle ou scalaire. 
En qualité d'exemples, on peut citer l’angle de rotation de l’arbre 
moteur, la vitesse de l’avion ou de la fusée, la pression de la vapeur 
dans la chaudière d’une machine à vapeur, la quantité d’objets aux 
entrepôts, le nombre d'avions basés sur un aérodrome, etc. 

Toutefois, dans la majorité des cas, pour décrire L'objet comman- 
dé, il faut recourir à plusieurs variables zx,;, . .., 

lors de la description des systèmes mécaniques, Ts variables zx; 
représentent les coordonnées ou les vitesses des pièces en mouve- 
vement ; 

pour les systèmes électriques, les variables x; seront des courants 
et des tensions; 

s’il s’agit de l’économie, on peut avoir affaire aux capacités de 
production ou aux ressources de différentes branches industrielles ; 

pour un système biologique, les variables x; peuvent caracté- 
riser la concentration des substances chimiques ou des médicaments 
dans divers organes. 

Dans tous les cas susmentionnés, l’état de l’objet commandé est 
décrit par la variable multidimensionnelle, c.-à-d. vectorielle, zx 
dont les composantes seront les variables z;: 


z = (x, ..., Zy). (6-1) 
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Dans ce qui suit, la variable x sera appelée variable ou vecteur 
d’etat de l’objet commandé. 

Les variables x; peuvent varier d’une façon continue dans une 
certaine gamme de valeurs ou bien elles peuvent prendre un ensem- 
ble fini de valeurs. Dans ce dernier cas, la variable x va prendre elle 
aussi un ensemble fini de valeurs et sa k-ième valeur sera notée par 


k (k Ch ; 
2 2 (209), ..., 2), k=1,...,n. (6-2) 


Alors, l’ensemble 
X = {x0,,..., 20} (6-3) 


représentera l’espace des états possibles de l'objet commandé. Parfois, 
l'espace X sera appelé espace des décisions pour souligner que le choix 
d’un certain x € X représente une solution possible du problème de 
commande. 

Si les variables z; peuvent varier d’une façon continue, c.-à-d. 
peuvent prendre une infinité de valeurs, l’espace des états possibles 
X du système sera un ensemble infini. Mais, dans ce cas aussi zx; 
ne peut d'habitude pas prendre des valeurs quelconques, car on peut 
lui imposer des contraintes qui, comme on l’a déjà remarqué, se 
présentent sous la forme de systèmes d'équations algébriques ou 
d'inégalités 

Ja (x, | Zn) {<, — 9 >} 0, U — 1, + °°? m. (6-4) 


Chacune des contraintes (6-4) conserve seulement un des signes, 
<, = ou >, mais différentes contraintes peuvent avoir des signes 
différents. Les quantités m et N ne sont pas liées entre elles, de sorte 
que m peut être supérieure, inférieure ou égale à V. En particulier, 
m peut être égale à zéro, ce qui signifie que la contrainte (6-4) est 
absente. Souvent, quelques-unes ou même toutes les variables zx; 
satisfont à la condition de non-négativité 


mZ>0, i=1,...,N. (6-5) 


La condition de non-négativité des variables est très commode 
lors de la résolution numérique des équations qui décrivent le proces- 
sus de commande. D'autre part, dans beaucoup de problèmes (éco- 
nomiques, par exemple) les variables x; ne peuvent pas prendre des 
valeurs négatives de par leur sens physique (frais, production, mar- 
chandises transportées, capitaux placés de différentes manières, etc.). 
Pourtant, même les problèmes dont les variables peuvent avoir 
n'importe quel signe, c.-à-d. satisfont aux contraintes de la forme 


T; > di, L — 4, .... N, (6-6) 


où a; sont des nombres arbitraires, peuvent facilement être transfor- 
més en problèmes à variables non négatives grâce à l'introduction 
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des nouvelles variables 
Ui = LL; — d;, L — {, _. N. (6-7) 


Outre la variable x, que nous allons considérer comme étant une 
grandeur mesurable et contrôlable, l’état de l’objet commandé 
peut dépendre d'une foule de facteurs non contrôlables ou partielle- 
ment contrôlables déterminés par l’ensemble des conditions exté- 
rieures qui entourent l’objet commandé. Le pilote, par exemple, peut 
régler le régime de l’avion en faisant varier la hauteur et la vitesse de 
vol, qui, dans ce cas, sont des paramètres contrôlables. Mais la con- 
sommation de combustible est sensiblement influencée par les condi- 
tions atmosphériques extérieures que le pilote ne peut prendre en 
considération que partiellement, sans pouvoir les changer ni les pré- 
voir d’une façon précise. 

Désignons par Ÿ l’ensemble entier des facteurs extérieurs incon- 
trôlables qui influent sur le processus de commande et appelons cet 
ensemble état de la nature. Dans beaucoup de cas, en idéalisant quel- 
que peu les phénomènes réels, on arrive à réduire la diversité infinie 
des conditions extérieures à un nombre fini d'états possibles de la 
nature Ô(), . .., Ü(U, c.-àa-d. à soumettre à l'examen l’ensemble 
fini 

9 = {00 ,..., 00}, (6-8) 


appelé dans ce qui suit espace des étais de la nature. Dans le cas ge- 
néral, les éléments 0 de l’ensemble 6 sont des grandeurs multidi- 
mensionnelles 


80 — (80, ..., 00), i—=1,...1. (6-9) 


L'impossibilité de contrôler parfaitement tous les facteurs exté- 
rieurs fait qu’au lieu de la connaissance précise de l’état de la nature 
® on se limite souvent à la connaissance des probabilités £ (d) des 
différents états de la nature Ÿ € 9. Les probabilités & (Ÿ), obtenues 
d’une façon ou d’une autre pour tous les Ÿ € 6 avant de procéder 
à la résolution du problème de commande, seront appelées probabi- 
lités a priori des états de la nature. Il est évident que les probabilités 
a priori £ (0), qui représentent la distribution des probabilités sur 
l'espace ©, doivent satisfaire aux conditions (5-4). 

Dans certains cas, l’état de la nature Ÿ doit être considéré comme 
une variable aléatoire continue pour laquelle l’espace des états de 
la nature © se présente comme un ensemble infini. Dans ces cas, la 
distribution des probabilités £ (8) se transforme en densité de pro- 
babilité. 

Pour décrire l'action orientée exercée sur l'objet commandé, 
introduisons la variable u et appelons-la action de commande ou tout 
simplement commande. De cette façon, le mot commande aura dans 
ce qui suit deux acceptions: 
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1) commande dans l’acception d'activité d'organisation déve- 
loppée dans le but d’atteindre certains objectifs; 

2) commande dans l’acception d'action de commande, c.-à-d. 
d’une certaine grandeur physique que l’on fait varier suivant notre 
désir et qui exerce une influence sur le caractère des processus ayant 
lieu dans l’objet commandé en les orientant de la façon requise. 

D'habitude, le contexte permet d'établir sans difficulté l’accep- 
tion dans laquelle est utilisé le mot « commande ». 

Lorsqu'on réalise la commande des objets complexes, il faut d’ha- 
bitude faire appel à plusieurs actions de commande u,, ..., un, 
de sorte que la commande v représente, dans le cas général, une gran- 
deur multidimensionnelle 


u = (Wu, ..., Ur). (6-10) 


Ainsi, le pilote peut changer le régime de vol en utilisant la com- 
mande w qui comporte l’action exercée sur la quantité de combusti- 
ble consommé (u.) et l’action exercée sur le gouvernail de profondeur 
(ue). 

Dans les systèmes réels, les actions de commande u; ne peuvent 
pas être prises indépendamment des différentes contraintes qui leur 
sont imposées. Désignons par U l’ensemble de toutes les valeurs des 
commandes uv qui satisfont aux contraintes imposées. Avec cela, toute 
u € U sera une commande admissible. Par la suite, on rencontrera 
souvent des problèmes dans lesquels l’ensemble des commandes ad- 
missibles U est un ensemble fini 


U={ut), ..., ul} (6-11) 


Les valeurs prises par les variables d’état x permettent de juger 
de l'efficacité de la commande w adoptée dans le but d'atteindre les 
objectifs fixés. Mais, dans beaucoup de cas, cela s’avère incommode, 
car les objectifs de la commande exprimés à l’aide des variables 
d'état peuvent donner lieu à des relations assez compliquées. C’est 
pourquoi, outre les variables d'état x, il est commode d'introduire 
des variables de sortie q qui expriment les objectifs de la commande 
d’une façon explicite. 

Parfois, on peut utiliser une variable d'état en qualité de variable 
de sortie, mais, dans le cas général, ce n’est pas ainsi. Par exemple, 
lors de la commande du régime de vol dans le but de minimiser la 
consommation de combustible sur un itinéraire donné, il est com- 
mode de prendre en qualité de variable de sortie le chemin parcouru 
par unité de combustible, tandis que les variables d’état seront re- 
présentées par la vitesse et l’altitude de vol de l’avion. Les variables 
de sortie peuvent être représentées aussi bien par des grandeurs phy- 
siques que par des indices économiques, par exemple, par le rende- 
ment, etc. En particulier, le critère de qualité de la commande peut 
aussi être examiné en tant que variable de sortie. 
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La variable de sortie q dépend tout d’abord de l'état x de l’objet 
commandé. Toutefois, elle peut être influencée par la commande 
adoptée uw et par les facteurs extérieurs incontrôlables Ÿ. Il s'ensuit 
que, dans le cas général, l’équation de la variable de sortie est de la 


forme 
q = Q (x, u, Ÿ). (6-12) 


L'interaction de toutes les variables examinées ci-dessus est 
montrée par le schéma synoptique d’un objet commandé de la figu- 
re 6-1. 


b) Equation d'évolution de l’objet commandé 


Sous l’action des signaux de la commande u, l’état de l’objet com- 
mandé change. Le caractère des processus qui s’y produisent est de- 


fini par la vitesse de variation de la variable d'état de l’objet z = 
— dzr/dt qui, conformément à (6-1), est une 


grandeur multidimensionnelle |° 
Z=(t, -.., En); (6-13) © Objet g 


. . | commonde 
OÙ Ty, - --, TN sont les vitesses de varia- 
tion des composantes de la variable mul- 
tidimensionnelle zx. 

Pour les systèmes dynamiques où les pro- Fig. 6-1. Schéma synop- 


cessus physiques évoluent continüment dans tique d’un objet com- 
mandue 


V4 


le temps, les vitesses x; à un certain moment 
dépendent de l'état de l’objet commandé au même moment, état qui 
à son tour est défini par les valeurs de la variable d'état x, l'état 
de la nature Ÿ et la commande adoptée u. Cette dépendance peut 
s'écrire sous la forme d’un système d’équations différentielles ordi- 
naires 


n=gl(z,u, d), æx(0)=c, i=d,...N, (6-14) 


où les grandeurs c; (i = 1, ..., N) caractérisent l’état initial de 
l'objet commandé. 

Parfois, il est commode de faire appel aux désignations vectoriel- 
les et de remplacer le système (6-14) par une seule équation 


z=g(z,u, d); x(0)=c. (6-15) 


Ici, c — (c,, ..., c;y), tandis que par g on entend une fonction 
vectorielle 


g = (uw - -. Ex). (6-16) 


L'introduction de la variable 8 en tant qu’argument dans l’équa- 
tion (6-15) s'avère incommode dans certains cas, car, durant l'évo- 


190 CH. 6. STRUCTURE DES PROBLEMES DE COMMANDE OPTIMALE 


lution d’un processus de commande, l’état de la nature reste souvent 
invariable. Toutefois, pour différents processus de commande, 
l’état de la nature peut être different, ce qui se traduit par un change- 
ment de la forme revêtue par l’équation du mouvement. Il est com- 
mode de marquer cette dépendance entre la forme d'équation et 
l'état de la nature en ajoutant l'indice Ÿ à la fonction g et d'écrire 
l'équation (6-15) comme suit: 


L=8 (u, tx), x(0)=c. (G-17) 


Si l’état de la nature reste inchangé durant l'évolution de tous 
les processus de commande considérés, l'indice Ÿ peut etre omis. 


6-4. CLASSIFICATION DES PROBLÈMES 
DE COMMANDE OPTIMALE 


a) Problème de décision à une étape 


D'habitude, dans les problèmes à une étape, on n'examine pas les 
méthodes de réalisation de la décision prise, ce qui signifie que l’on 
ne détermine pas la valeur et le caractère de l’action de commande 
u, mais on passe directement à la détermination de la valeur de la 
variable d'état x du système, valeur qui permet d'atteindre de la 
meilleure façon les objectifs de la commande. 

Un problème de décision à une étape est considéré donné si l’on 
donne l’espace des états de la nature © avec la distribution de pro- 
babilités £ (9) pour tous les Ÿ € ©, l’espace des décisions X et le 
critère de qualité de la décision adoptée qui, pour ce cas, sera appelé 
fonction objectif. Dans les ouvrages spécialisés, la fonction objectif 
est aussi appelée fonction de gains ou fonction de pertes. La fonction 
objectif qui exprime explicitement les objectifs de la commande 
peut être considéréeen tant quegrandeur de sortie de l’objet comman- 
dé et notée par q. La fonction objectif est une grandeur scalaire dé- 
pendant de l’état de la nature Ô et de l’état de l’objet commandé zx, 
qui, par analogie à (6-12), peut s’écrire sous la forme 


q = Q (x, Ô). (6-18) 


On voit donc que le problème de décision à une étape représente 
un triplet 


G=(X, 6, 9), (6-19) 


où g est une fonction scalaire définie sur le produit direct des ensem- 
bles X X 6. Trouver la solution de ce problème veut dire trouver un 
xt € X tel que la fonction q atteigne son minimum, c.-à-d. 


xt — {xEX:Q (x, 8) = min}. (6-20) 
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Remarquons que s’il s’agit de maximiser la fonction g, cette opé- 
ration se fait sans aucune difficulté, car si pour zx = x*, la fonction 
Q (x, #) atteint son maximum, pour Île même zx, la fonction 
—Q (x, Ÿ) atteindra son minimum. 

Il y a plusieurs méthodes de résolution du problème de décision 
à une étape. L'application de telle ou telle méthode dépend de 
la façon dont on définit l’ensemble des décisions admissibles X, de 
l'information que l’on possède sur l’état de la nature et de la forme de 
la fonction objectif g. Ci-dessous on trouvera une brève caractéris- 
tique des méthodes principales. 

Un problème est appelé déterminé s'il n’y a pas d’indétermination 
en ce qui concerne l’état de la nature. Dans les problèmes détermi- 
nés, l’espace des états de la nature © ne comporte qu’un seul élé- 
ment Ÿ, dont la probabilité est égale à l’unité. Dans ce cas, la fonc- 
tion objectif dépendra seulement de l'état de l’objet commandé 


q = Q (Go, 2) = q (ti - .., xx). (6-21) 


Un problème déterminé à une étape est appelé problème classique 
d'optimisation [44] s'il contient des contraintes de la forme (6-4) 
parmi lesquelles il n’y a pas d'inégalités, ni de conditions de non- 
négativité ou de conditions demandant que les variables soient 
discrètes, si m << N et si les fonctions f; (x, . .-., zx) et q (x) — 
= q(Z,, -.-., zNx) Sont continues et admettent des dérivées partiel- 
les du deuxième ordre au moins. Dans ce cas, le problème est formu- 
lé de la façon suivante. Soient les contraintes de la forme 


fi (Tr 1 T x) — 0, L — 1, ss M. (6-22) 


Trouver les valeurs de z,, . . ., x, vérifiant les équations (6-22) 
et rendant minimale la fonction gq (x, . .., zn). 

La particularité de ces problèmes consiste dans le fait qu’ils peu- 
vent (au moins en principe) être résolus par des méthodes classiques 
basées sur le calcul différentiel. En effet, les équations (6-22) per- 
mettent d'éliminer m variables. De cette façon, la fonction objectif 
est ramenée à la forme 


q (Zi . zx) — Qi (Ya . YN-m): (6-23) 
OÙ Par Yy, + + > Yx-m SOnt désignées les variables restantes. Main- 
tenant, le problème consiste à trouver les valeurs de y, ..., y\_m 
qui minimisent la fonction q, et auxquelles aucune contrainte n’est 
imposée. Cette solution peut être trouvée à partir du système d’équa- 


tions obtenues en égalant à zéro les dérivées partielles de la fonc- 
tion q: 


LT  — V — 9, 
dy; = 0, i= 1, .., N mm. (6-24) 


Mais cette voie est d'habitude liée à des calculs encombrants, ce 
qui rend nécessaires d’autres méthodes de résolution. 


192 CH. 6. STRUCTURE DES PROBLÈMES DE COMMANDE OPTIMALE 


Ces derniers temps, on s'intéresse beaucoup aux méthodes de 
résolution des problèmes à une étape connues sous le nom de program- 
mation mathématique. Ces méthodes permettent de trouver les valeurs 
des variables zx,;, . .., x, satisfaisant aux contraintes de la forme 
(6-4), qu'elles soient exprimées par des égalités ou par des inéga- 
lités, et rendant minimale la fonction objectif q (x, . .., zx). 
Habituellement, on impose aux variables des conditions supplé- 
mentaires de non-négativité. Il faut remarquer que la programmation 
mathématique représente une forme algorithmique et non pas analy- 
tique de résolution du problème, c.-à-d. elle ne donne pas la formule 
du résultat final, mais indique seulement la procédure de calcul qui 
conduit à la solution du problème. Pour cette raison, l'efficacité 
des méthodes de la programmation mathématique est particuliè- 
rement évidente lors de l'utilisation des calculatrices numériques. 

Le plus simple cas de problème de programmation mathématique 
est représenté par le problème de programmation linéaire. Ce dernier 
problème correspond au cas où les premiers membres des contraintes 
(6-4) et la fonction objectif (6-21) sont des fonctions linéaires de 
Lis - --, TNA. Dans un problème de programmation linéaire, on de- 
mande de trouver les valeurs non négatives des variables x,, . .., zy 
qui rendent minimale la fonction objectif 


N 
q (Zi +. TN) = > b;z; (6-25) 
2:= 
et satisfont au système de contraintes 
N 
> dit; LO, i=iÂ,..., m. (6-26) 
J= 


Tout problème de programmation mathématique qui diffère 
du problème formulé ci-dessus est appelé problème de programmation 
non linéaire. Dans les problèmes de programmation non linéaire, la 
fonction objectif (6-21), ou les premiers membres des contraintes 
{6-4), ou bien les deux à la fois, sont des fonctions non linéaires de 
Ts - - + Ty. Aux problèmes de programmation non linéaire se rap- 
porte également le problème dans lequel la fonction objectif et les 
contraintes sont respectivement de la forme (6-25) et (6-26), mais 
on suppose, par exemple, que les variables soient des entiers. Ce 
problème est appelé problème de programmation en nombres entiers. 

Les problèmes de programmation non linéaire sont beaucoup plus 
compliqués par rapport aux problèmes de programmation linéaire 
et à l'heure actuelle on ne dispose de méthodes de calcul que pour un 
nombre restreint des problèmes de ce type. Ci-après, on trouvera un 
exposé détaillé des méthodes de résolution des problèmes de program- 
mation linéaire. Les méthodes de résolution des problèmes de pro- 
grammation non linéaire peuvent être trouvées dans [10, 44 à 46]. 
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Un problème de décision à une étape est appelé stochastique si 
l’espace des états de la nature 6 comporte plus d’un élément, de sorte 
que l’on ne connaît pas l’état réel de la nature Ÿ, mais la distribution 
de probabilités E (0) sur l’espace ©. 

Les problèmes stochastiques où il faut trouver les valeurs des va- 
riables satisfaisant aux contraintes (6-4) et minimisant la fonction 
objectif (6-18) sont des problèmes de programmation stochastique. 
Toutefois, dans beaucoup de cas, on parvient à ramener les pro- 
blèmes de programmation stochastique aux problèmes de programma- 
tion linéaire ou non linéaire en définissant d'une façon un peu diffé- 
rente la fonction objectif. En effet, etant donné que l’état de la na- 
ture Ô est une variable aléatoire avec la distribution de probabilités 
E (8) sur l'espace ©, la valeur de Q (Ÿ, x). pour z— (x,, ..., x) 
donné, sera aussi une variable aléatoire avec la mème distribution 
de probabilités & (9) sur l’espace 6. Pour cette raison, dans ce cas, 
il est rationnel de prendre en tant que fonction objectif la valeur 
moyenne de la fonction Q (#, x) sur l’espace 6. 

Ainsi, pour les problèmes stochastiques, la fonction objectif peut 
être définie conformément à (5-64) par l'expression 


a(n= 2 E(0)Q(S, 2. (6-27) 


Ô 


Vu que 9, (x) est une fonction déterminée de zx. le problème qui 
consiste à trouver les variables z,, . . ., x, satisfaisant aux contrain- 
tes (6-4) et minimisant la fonction objectif (6-27) peut être résolu 
a l’aide des méthodes de la programmation linéaire ou non linéaire. 

Ün cas important de problème de décision stochastique à une 
étape se présente lorsque les grandeurs zx; (i = 1, ..., N) ne peu- 
vent prendre qu’un ensemble fini de valeurs, c.-à-d. les contraintes 
imposées aux valeurs des variables sont données sous la forme d’un 
espace des décisions ZX défini par la relation (6-3). Les méthodes de 
résolution des problèmes de ce type font l’objet de la branche des 
mathématiques appelée théorie des décisions statistiques. 

Actuellement, on s'intéresse beaucoup aux problèmes où la dé- 
cision n’est pas prise par une seule personne mais par plusieurs (par 
exemple, deux) dont les intérêts sont opposés. Comme exemple on 
peut citer le problème de la poursuite dans lequel la distance qui 
sépare le poursuiveur du poursuivi dépend des décisions de ces deux 
personnes. Dans ce cas, le poursuiveur tâche de réduire cette distance 
au minimum, tandis que le poursuivi tend à la rendre maximale. 
Des problèmes pareils ont été appelés sifuations de conflit, les mé- 
thodes de leur résolution étant examinées par la théorie des jeux. Les 
personnes qui participent au jeu s'appellent joueurs. 

Etant donné que dans une situation de conflit les décisions sont 
prises par chacun des joueurs indépendamment des décisions prises 
par l’autre joueur, en décrivant mathématiquement la situation de 


13—0732 
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conflit il convient de considérer l'espace des décisions comme un 
produit direct de deux ensembles 


X xY, (6-28) 


où X — {z,, ..., x,} est l’espace des décisions du premier joueur, 
Y = {y,, ..., Yn} l’espace des décisions du deuxième joueur. 

Les éléments de l’espace des décisions X X YŸ seront des couples 
de la forme (x, y), xE€ X,yEŸY, c.-à-d. seront définis par les déci- 
sions prises aussi bien par le premier joueur que par le deuxième. 
Pour plus de simplicité, admettons qu’il n’y a pas d’indétermination 
dans l’état de la nature. Alors, la fonction objectif ne dépendra que 
des éléments de l’espace À X Y et aura la forme 


qg = Q(x y). (6-29) 


L'opposition des intérêts des joueurs consiste dans le fait que 
le premier joueur, qui fait son choix dans l’ensemble X, tâche de 
minimiser la fonction objectif. tandis que le deuxième joueur. qui 
a à sa disposition l’ensemble Y, tend à la maximiser. Ainsi. l’essen- 
ce d'une situation de conflit réside en ce que chaque joueur doit 
prendre la meilleure décision à son point de vue, compte tenu du 
fait que son adversaire en fera autant. 


b) Problèmes dynamiques d’optimisation de la commande 


Parmi la grande variété de problèmes de la cybernétique, une 
place importante revient aux problèmes dont l’objet commandé 
subit une évolution perpétuelle sous l’action de divers facteurs 
extérieurs et intérieurs. Les problèmes de commande de pareils 
objets se rapportent à la classe des problèmes de commande dynami- 
ques. 

Un objet est appelé commandable (gouvernable) si le caractère 
de son évolution peut être changé en actionnant sur certains des 
facteurs à l'influence desquels il est soumis. Comme il a été déjà 
indiqué, les actions orientées vers un but bien déterminé sont appe- 
lées commandes et désignées par u (t). 

Le caractère de l’évolution de l’objet commande est défini par 
le système d'équations différentielles (6-14) qu'il est commode 
d'écrire de façon condensée sous la forme vectorielle comme une 
seule équation différentielle (6-17). La commande w (t) fait partie 
de l'équation (6-17), donc cette dernière ne définit pas une évolu- 
tion concrète de l'objet, mais seulement ses possibilités techniques 
qui peuvent être mises en valeur en adoptant telle ou telle commande 
comprise dans l’espace des commandes admissibles U. 

On peut porter une estimation sur l'efficacité de tel ou tel mode 
de commande en introduisant une fonction objectif du type (6-12) 
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qu'il est commode d'écrire, dans ce cas, sous la forme 
qg = Qelz(t), u (é)]. (6-30) 


De cette façon, si u (ft) est la consommation instantanée de com- 
bustible et si x (t) est la vitesse instantanée de l'avion, alors, du 
point de vue de la consommation de combustible, la qualité de la 
commande peut être caractérisée à tout moment par la grandeur 
yg(t) = u(t}/x(t) (consommation instantanée de combustible par 
unité de chemin parcouru) qui évidemment sera fonction de l’état 
de la nature ©, c.-àa-d. de l’ensemble des facteurs extérieurs qui 
déterminent les conditions de vol. 

La fonction objectif de la forme (6-30) n’est utilisée que rarement, 
car elle donne seulement l’estimation des valeurs instantanées 
du processus commandé, tandis que dans la grande majorité des 
problèmes il est nécessaire d'estimer les processus qui évoluent 
dans l’objet commandé durant toute la période de commande allant 
de O0 à T. 

Dans beaucoup de cas, la fonction odjectif peut être choisie de 
façon que l’on arrive à estimer le processus qui se déroule dans 
l’objet commandé en intégrant la fonction objectif sur toute la 
période de commande, c.-à-d. on peut prendre en tant que critere 
de qualité de la commande la fonctionnelle 

T 


J (u)= | Oo lr (), u(P]dt. (6-31) 


0 


Ainsi, lorsque le sens physique de la fonction objectif se traduit 
par des pertes, l’expression (6-31) définit les pertes totales durant 
tout le processus de commande. 

Parfois. on arrive à donner en tant qu’objectif de la commande 
la marche désirée du processus z (t). Ici, on peut prendre en qualité 
de fonction objectif le carré ou la valeur absolue de l'écart du proces- 
sus x ({) par rapport à la marche désirée 


(2 —20E, g=lrD—z(l. (6-32) 


Dans ces cas, le critère de qualité de la commande (6-31) définit 
l'erreur totale quadratique ou l'erreur absolue. 

Dans les problèmes de commande dynamiques, outre les con- 
traintes de la forme (6-11), qui définissent l’espace des commandes 
admissibles U, on a affaire à des contraintes intégrales de la forme 


Helz(t), u(t)] dt LK = const. (6-33) 


C'_— CS 


Très souvent, par exemple, on est obligé de réduire les limites 
de variation des valeurs instantanées d’un certain paramètre a (zx, u) 


13% 
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durant le processus de commande. Désignons par a, la valeur du 
paramètre a qu'il n’est pas recommandable de dépasser. Si la fonc- 
tion figurant sous le signe d'intégration H (x, u) est définie à 
partir de la relation 


0 
(zu) = | [a(x, u)—ao]* pour a(x, u) >4@. 
la contrainte intégrale (6-33) exprimera l'exigence imposant que 
la valeur instantanée du paramètre a ne dépasse a, que pour un 
court laps de temps et d’une quantité insignifiante. Cette condition 
sera d'autant plus rigoureuse que plus petit sera Æ. Ainsi, pour 
K = 0, la contrainte (6-33) n’admettra pas que a dépasse a, si insi- 
gnifiant que soit ce dépassement. | 

Des contraintes de la forme (6-33) surgissent aussi lorsqu'on 
a affaire à des ressources limitées: c’est l'énergie ou le combustible 
disponibles qui peuvent être limités s’il s'agit de la trajectoire, etc. 

Les relations citées permettent de formuler de la façon suivante 
la définition de la commande optimale des systèmes dynamiques. 
Une commande u* (t) choisie dans l’espace des commandes admis- 
sibles U est appelée optimale pour l’objet décrit par l’équation 
différentielle (6-17) si elle minimise le critère de qualité (6-31) en 
présence des contraintes données imposées aux ressources utilisées 
(6-33). 

Les problèmes de commande dynamiques de mème que les proble- 
mes à une étape peuvent être déterminés si l’espace des états de la 
nature 6 ne comprend qu'un seul élément Ÿ — Ÿ,, ou stochastiques 
lorsque l’espace des états de la nature 6 comporte plus d’un élé- 
ment et lorsqu'on donne la distribution a priori des probabilités 
£ (0) sur l’espace ©. 

Parmi les problèmes stochastiques une place importante est 
occupée par les problèmes de commande adaptative. Cette commande 
est adoptée dans les cas où les données a priori sur l’état de la nature 
sont insuffisantes pour assurer une commande efficace, ou bien si 
l’on n’est pas en possession d’une description mathématique suf- 
fisamment précise de l’objet commandé lui-même. La commande 
adaptative a pour but de préciser les données concernant l'état 
de la nature ou les propriétés de l’objet commandé directement 
durant le processus de commande de ce dernier en essayant diffe- 
rents modes de commande pour trouver celui qui, dans les condi- 
tions concrètes données, est le plus efficace. 


our a(x. u)< @; 
P ( )< (6-34) 


c) Commande de l'état final 


Il y a toute une série de cas où le caractère de l’évolution de 
l’objet durant le processus de commande ne présente pas d'intérêt, 
car ce n’est que l’état auquel arrivera l’objet à la fin du processus 
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de commande qui nous intéresse. En voici quelques exemples: 
l'atterrissage aux instruments qui impose des exigences très rigou- 
reuses à la vitesse et à la position que l’avion occupe à l'instant de 
contact du sol, la livraison de la charge dans le délai fixé au point 
de destination, l'obtention à la fin de l'année de la productivité 
du travail fixée, etc. Ces problèmes ont été appelés problèmes de 
commande de l'état final. 

Désignons par r (T) l’état de l'objet à l'instant final. La fonc- 
tion objectif pour ce problème sera de Îàa forme: 


q = Qo x (TI. (6-35) 


Etant donné que x (7) dépend du caractère de la commande 
adoptée u (£), la valeur de g sera aussi fonction de cette commande. 
C'est pourquoi, pour ce cas, le problème du choix de la commande 
optimale peut être formulé de la façon suivante: choisir dans l’espace 
des commandes admissibles ÜU une commande u* (ft) telle que la 
fonction objectif (6-35) soit minimisée pour l'objet décrit par 
l'équation différentielle (6-17) en présence des contraintes (6-33) 
imposées aux ressources utilisées. 


d) Jeux différentiels 


La théorie des jeux différentiels c’est l'extension de la théorie 
des jeux pour les problèmes à une étape au cas des problèmes de 
commande dynamiques. À un jeu différentiel comme à un jeu ordi- 
naire participent deux personnes appelées joueurs dont les intérêts 
sont opposés. D'autre part, chacun des joueurs peut, dans une cer- 
taine mesure, influer sur la situation en actionnant sur l’objet 
par l'intermédiaire de sa propre commande. Cela signifie que dans 
les jeux différentiels l'espace des commandes admissibles représente 
le produit direct des ensembles 


U x V, (6-36) 


où U est l’espace des commandes admissibles du premier joueur 
contenant les éléments u (t) et V l'espace des commandes admis- 
sibles du deuxième joueur à éléments v (4). De cette façon. les élé- 
ments de l’espace des commandes admissibles seront constitués par 
des couples de la forme (u, v)},uE U,vE V. 

S'il n’y a pas d’indétermination relative à l’état de la nature, 
l'équation différentielle qui décrit l’évolution de l’objet commandé 
sera obtenue à partir de (6-17) par la substitution du couple (u, v} 
à u, c.-a-d. sera de la forme 


x=g(ru,v), r(0)=c. (6-37) 
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Habituellement, les jeux différentiels représentent des pro- 
blèmes de commande de la valeur finale. Pour cette raison, la fonction 
objectif dépend de l’état de l'objet à l'instant final T7, état qui à 
son tour est défini par les commandes utilisées et peut donc s'écrire 


qg = Qlz(T)l, z(T) = f lu (), v (#)]l. (6-38) 


Les buts des joueurs sont opposés, car pendant que le premier 
joueur, en choisissant la commande u dans l’espace L’, tend à mini- 
miser la fonction objectif, les intérêts du deuxième joueur imposent 
qu'il choisisse dans l’espace V une commande v telle que la fonction 
objectif atteigne son maximum. La façon de trouver, dans cette 
situation contradictoire, la meilleure commande pour chacun des 
joueurs constitue l'essence de la théorie des jeux différentiels [47]. 

Voici quelques exemples de situations typiques pour les jeux 
différentiels : les combats, les combats aériens, le football, la pour- 
suite d’un navire par une torpille, la défense des objectifs contre 
une attaque ennemie, etc. 
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a) Comportement d’un système dynamique 
en tant que fonction de l’état initial 


Dans beaucoup de cas, on arrive à simplifier sensiblement la 
recherche de la commande optimale dans les systèmes dynamiques 
si l’on réussit à décomposer, d’une façon naturelle ou artificielle, 
le processus de commande en étapes isolées. 

Pour entreprendre l’examen sous une forme générale, nous allons 
considérer que l’état de l’objet est décrit par la variable multidi- 
mensionnelle 


z= (20), ..., x), (6-39) 


En supposant que le processus soit non commandable et qu'il 
n'y ait pas d'indétermination dans l’état de la nature, ecrivons par 
analogie à (6-17) l’équation différentielle, qui définit l’évolution 
de l'objet, sous la forme 


z=g(x). r(0)=c. (6-40) 


La solution de cette équation se met d'habitude sous la forme 
= tZ(t) en soulignant de cette façon qu’elle dépend du temps. 
Toutefois, il n’est pas moins important que la solution de l’équa- 
tion (6-40) dépende de l’état initial c. C'est pourquoi une écriture 
plus rigoureuse montre la dépendance explicite de la solution x 
aussi bien du temps que de l’état initial: 


— Z(c,t) = xx (0), 4]. (6-41) 
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Une telle écriture permet de considérer l’état du système à un 
moment arbitraire { comme une transformation de l’état initial 
z (0) — c sur l'intervalle 1. 

Examinons l'évolution de l’objet sur l'intervalle de O0 à £#, que 
nous allons décomposer, à l’aide d’un point intermédiaire £,, en deux 
intervalles de durée #, et T = é, — t, 


comme le montre la figure 6-2. Exami- » !, !, 
nons trois états de l’objet commandé: > ———— 
état initial x (0) = c; z 


état x (c, {,) correspondant au mo- 
ment intermédiaire £;; 

état zxz(c, ft.) correspondant au 
moment final #.. 

La description du dernier état peut être abordée de deux ma- 
nières. Cet état peut être considéré comme une transformation de l’état 
initial x (0) = c sur l'intervalle #, = t, + 7% 


T(c,te) = x (ct + T), (6-42) 


ou bien en tant qu'une transformation de l’état x (c, {,) sur l'inter- 
valle T 


Fig. 6-2. Décomposition d'un 
intervalle en deux étapes 


z(c,te) = xiz(c, ti}, tl. (6-43) 


Etant donné que ces deux expressions traduisent le même état, 
en les égalant on obtient la relation 


TZ (c, d + 1) = TZ [x (c, ti), Tl. (6-44) 


b) Représentation d’un processus dynamique 
sous la forme d’une suite de transformations 


Supposons que le processus dynamique zx (c, t) puisse être pré- 
senté sur l'intervalle allant de 0 à £’ d’une façon naturelle ou arti- 
ficielle sous la forme d’un processus à étapes multiples et proposons- 


0 é, b ln.1 ty“t" 
Tr T2 Ty 


Fig. 6-3. Décomposition d’un intervalle en #7 étapes 


nous de le décrire d’une façon convenable. Pour obtenir un proces- 
sus à étapes multiples, l'intervalle de O à #’ doit être décomposé 
en x étapes successives de durées T;, Ts, . . ., Tn, Comme il est 
montré sur la figure 6-3. Désignons par £4 (k— 0, ..., n) les moments 
où prend fin la k-ième étape de sorte que fy,+1 == {x + Tr+1, et par 
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zr l’état de l’objet au moment !t,: 
Tr = ZX (c, t). (6-45) 
L'état | 
Thai = LC: lurs) = LC, ln + Tnt). (6-46) 
Suivant (6-44) et (6-45), cette expression peut être mise sous la 
forme 
Thai = TTC. tx), Ta] = L(Lr, Tu). (6-47) 
La relation (6-47) représente l’état de l’objet x,+, en tant que 
résultat de la transformation de l’état x; subie durant la (4 + {)-ième 
étape. 


Introduisons l'opérateur 7 pour désigner la transformation de 
l'état du processus durant une étape: 


T'(xx) = zx (xx, Th+1)s k—=0,....n—f. (6-48) 
Alors la relation (6-47) va s’écrire 
Tuxs = L'(TR). (6-49) 


En mettant #4 — 0, 1, ..., nr — 1, on peut décrire le processus 
dynamique tout entier sous la forme d'une suite de transformations 


Lo" C, Zn To), ..., Tn = T (Lui). (6-20) 


c) Processus de commande à étapes multiples 


Le processus dynamique décrit par la transformation (6-49) est 
un processus non commandable. Pour obtenir un processus comman- 
dable à étapes multiples, il faut avoir la possibilité d'effectuer 
à chaque étape non pas une transformation T (r;) mais une 
transformation comprise dans l’ensemble des transformations 
Ti (zx), .…. T', (zx). 

Il est commode de considérer qu’une forme de transformation 
concrète va dépendre d’un paramètre z, qui, à la k-ième étape, peut 
prendre une valeur de l’ensemble de valeurs l,. Dans ce qui suit, 
le paramètre u, sera appelé commande, tandis que l’ensemble U, 
sera l’espace des commandes admissibles à la k-ieme étape. Mainte- 
nant. la transformation réalisée à la k-ième étape peut s’écrire sous 
la forme 


Lhei=T (tr, Un), Ur EUR. (6-51) 


Si l’on met successivement dans la relation (6-51) À — 0, 1, . .. 
.., nr — 1 et si l’on tient compte de l’état initial xr,, on obtient 
la description de tout le processus commandable à étapes multiples : 


Lh+1 T (Zu, Un). Un € Ur Ù 


k=0,1,....n—1; r—=z(0)=c. (6-52) 
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La relation (6-52), qui est appelée équation aux différences de 
l’objet commandé, est analogue à l'équation différentielle (6-17} 
qui décrit un processus dynamique continu. 


Exemple 6-1. Supposons que la variable d'état soit} une variable bidimen- 
sionnelle z = (r%), x) qui peut prendre les valeurs déterminées géométrique- 
ment parles mailles de la grille représentée sur la figure 6-4, a. Pour passer 
d’une maille de grille à la maille suivante, on peut utiliser à chaque étape une 


Fig. 6-4. Processus à étapes multiples à une variable bidimensionnelle 


des deux commandes possibles: u, = 0 (déplacement horizontal) ou uy = 1 
(déplacement vertical). Il s’ensuit que l’espace des commandes admissibles est 
le même pour toute étape et est égal à U, = {0, 1}, k -: 0, 1,..., n — 1. 
Examinons une case de la grille donnée représentée sur la figure 6-4, b, au 
coin inférieur gauche de laquelle le système est arrivé après la k-ième étape, de- 
façon que x, = (a, b). La valeur de x, = T (xs, u) est fonction de la com- 
mande adoptée. La figure 6-4,b montre que les relations ci-dessous ont licu: 


T [(ai, 01), 0] = (as, by) —rh+1; 

T I(@s, b1), 1] (a, ba) —rn+1. 
On peut décrire une trajectoire concrète du mouvement du système en 
indiquant l’état initial r, et la suite des commandes adoptées. Ainsi, la trajec- 


toire marquée en trait fort sur la figure 6-4, a s'obtient en adoptant la commande. 
u — (01101001), les conditions initiales étant r, — (æ&. B). 


d) Critère de qualité de la commande 
pour un processus à étapes multiples 


Nous allons considérer que la qualité de la commande est déter- 
minée par la valeur de la fonction objectif q dont la valeur numérique 
peut être considérée en tant que pertes subies en adoptant telle ou 
telle commande. Les pertes correspondant à une étape seront fonc- 
tion de l’état du processus au début de cette étape et de la commande 
qui y est adoptée, c.-à-d. 


IR — Q (zh, Up), Ur € Ur. (6-53). 
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Comme critère de qualité de la commande on peut prendre les 
pertes totales correspondant à toutes les nr étapes du processus en 
présentant alors le critère de qualité de la commande d’un processus 
à n étapes sous la forme 


n— | 


Th (4) — à Q (th Up). (6-54) 


Ici, on désigne par la suite de commandes, c.-à-d. un ensemble 
ordonné de la forme 


U = (to, ….. Un-1)» uo € Uo. +. Un-1 € Un-1. (6-59) 


Si l’on considère un processus à étapes multiples de commande 
de la valeur finale, les pertes vont dépendre seulement de l’état de 
l'objet commandé à lafin du processus, état qui à son tour est fonc- 
tion de l’état initial et des commandes adoptées à chaque étape: 


q = q (tn) = Q (x, u), (6-56) 


où u est définie par la relation (6-55). La grandeur scalaire définie 
par l'expression (6-56) sera appelée fonction objectif du processus de 
<ommande à étapes multiples. 

Le problème de recherche de la commande optimale pour un 
processus à étapes multiples peut être formulé de la façon suivante. 
Pour un système dynamique dont les processus sont décrits par 
l'équation aux différences (6-52), il faut trouver une suite de com- 
mandes uy, Uj, . - ., Un_1, Satisfaisant aux contraintes de la forme 
ur E Un. k = 0, 1, ..., n — 1, telle que le critère de qualité de 
la commande (6-54) ou la fonction objectif (6-56) atteigne son mini- 
mum. 

Etant donné que les processus de commande à étapes multiples 
représentent un Cas particulier des processus de commande dynami- 
ques. on peut y trouver tous les types de problèmes examinés déjà 
dans les problèmes de commande dynamiques. Ainsi, lorsque l’espace 
des états de la nature © ne comporte qu’un seul élément Ÿ,, le pro- 
blème de commande à étapes multiples est appelé déterminé. 
Dans le cas contraire, il se rapporte à la classe de problèmes stochas- 
tiques. 

Il est à remarquer que l’on n'arrive pas toujours à situer d’une 
façon univoque tel ou tel problème dans la classe des problèmes 
à étapes multiples ou dans celle des problèmes à une étape. Ainsi, 
lorsque dans un problème à étapes multiples on considère la suite 
des valeurs de la variable, prise aux étapes isolées, en tant qu'une 
variable multidimensionnelle, le problème à étapes multiples se 
transforme en un problème à une étape. 
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6-6. PROBLÈME DÉTERMINÉ D'OPTIMISATION 
À UNE ÉTAPE À UNE VARIABLE D'ÉTAT UNIDIMENSIONNELLE 


a) Position du problème 


Parmi la grande variété de problèmes d'optimisation de la com- 
mande, le problème à une étape à une variable unidimensionnelle 
occupe une place un peu particulière. Cela s'explique par le fait 
que, d'une part, les problèmes de ce genre se rencontrent très sou- 
vent dans la pratique et, d’autre part, beaucoup de problèmes à 
étapes multiples et de problèmes à une étape à une variable multi- 
dimensionnelle comportent en tant qu'’étapes isolées de leur résolu- 
tion le problème à une étape à une variable unidimensionnelle. Bien 
que le problème d'optimisation à une étape à une variable unidi- 
mensionnelle puisse, dans la majorité des cas, être résolu par les 
moyens de l'analyse mathématique classique étudiée dans les mathé- 
matiques supérieures, en mettant au clair certaines propriétés de 
la solution et en utilisant certains procédés de calcul, on arrive 
souvent à simplifier considérablement la marche de la résolution. 

Le problème déterminé d'optimisation à une étape à une variable 
unidimensionnelle” peut être formulé de la façon suivante. Soient R 
l’ensemble des nombres réels, À = R l’ensemble des valeurs admis- 
sibles de la variable unidimensionnelle x, q (rx) une fonction de x 
définie sur l’ensemble X. On demande de trouver la valeur de rx € X 
(notée dans ce qui suit par z*) qui minimise ou maximise gq (x), 
c.-à-d. satisfait à la condition 


2% = {zE X:q(x) = min (max)}. (6-57) 
Les méthodes de résolution de ce problème dépendent du caractere 
de l’ensemble X des valeurs admissibles de la variable, que nous 


allons supposer défini sur un intervalle réel fini. Ci-après seront 
examinés quelques cas particuliers. 


b) Cas d'un ensemble fini de solutions admissibles 


Examinons le cas où l’ensemble des solutions admissibles est 
un ensemble fini: 


X = {x, -.., xx}. (6-58) 
Dans ce cas. la fonction objectif q (x) sera représentée par l’en- 


semble des nombres réels Q qui peuvent être considérés comme une 
application de l’ensemble X dans l’ensemble des nombres réels R : 


Q:X—h. (6-59) 


Les éléments de l’ensemble @, c.-àa-d. les valeurs de q (x) pour 
tous les z EX, peuvent être calculés. 


204 CH. 6. STRUCTURE DES PROBLEMES DE COMMANDE OPTIMALE 


La voie générale qu'il faut suivre pour trouver la valeur optimale 
z* consiste à comparer entre eux deux à deux tous les éléments de 
l'ensemble Q et à trouver ainsi l’élément minimal ou maximal. Cette 
voie est simple à condition que l’ensemble X. donc l’ensemble Q 
aussi, possède un nombre réduit d'éléments. Mais si l’ensemble X 
comporte un grand nombre d’éléments, cette méthode exige beaucoup 
de temps, ce qui est lié avant tout à la nécessité de calculer à maintes 
reprises les valeurs de q (x). 

Cette procédure ne peut être simplifiée que par la diminution 
du nombre d'éléments de l’ensemble X.Cela peut se faire en élimi- 
nant les éléments qui à coup sûr ne contiennent pas la valeur r* 
(cette certitude est acquise non pas à la suite des calculs des valeurs 
de q{z) mais sur la base de certains autres indices accessoires). 
Dans ce qui suit, on donnera des exemples d'utilisation de cette 
méthode qui, bien sûr, ne doit pas être exclue lors de la résolution 
des problèmes aux variables multidimensionnelles. 


c) Cas d’un ensemble infini borné 
des solutions admissibles 


Le plus souvent, on rencontre le cas où l’ensemble X des valeurs 
admissibles de la variable représente un intervalle réel continu 
borné par les nombres a et d: 


X = {ER:a<zr<b}= la, bl]. (6-60) 


Supposons que la fonction q (x) soit continue et différentiable 
en chaque point de l'intervalle {a, b] à l'exception, peut-être, d’un 
nombre fini de points. Une fonction 
g(x) L satisfaisant à ces conditions est repré- 

| ( sentée sur la figure G-5. 


| Désignons comme auparavant par 


| 
| | 

| M! x* la valeur de x € X pour laquelle 

| | la fonction q(zx) atteint son mini- 

L | x mum ou son maximum. Pour déter- 

a D D  b miner x*, utilisons le théorème bien 


connu de l’analyse mathématique 
suivant lequel une fonction continue 
et différentiable ne peut présenter 
un maximum ou un minimum qu'aux points où sa dérivée est 
nulle. Ces points peuvent être trouvés de l'équation 


q (x) = 0. (6-61) 


Fig. 6-5. Exemple d'une fonc- 
tion objectif 


Mais l'intervalle (a, b] peut contenir des points où il n’y a pas 
de dérivée, comme, par exemple, le point À/ sur la figure 6-5 ou 
bien les extrémités a et b de l'intervalle. En ces points, qui ne véri- 
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fient pas la condition (6-61), la fonction g (x) peut aussi présenter 
un maximum ou un minimum. 

Pour formuler la règle générale, introduisons les désignations 
suivantes. Deésignons par 


Si={rEX: q'(2) =0} (6-62) 


l’ensemble des points de l'intervalle {a, b] auxquels la dérivée 
s’annule : 
Ss—{xE ZX: q'(x) n'existe pas} (6-63) 


l'ensemble des points de l'intervalle [a, b|] auxquels il n'y a pas 
de dérivée; 
S3—{a, b} (6-64) 


l'ensemble des points comportant les extrémités de l'interval- 
le [a. b]. 

La valeur x* qui minimise ou maximise q (x) doit obligatoire- 
ment se trouver soit parmi les points de l’ensemble S,, soit parmi les 
points de l’ensemble S$,, soit encore parmi les points de l’ensemble 
Sa Autrement dit, la valeur de x = z* doit être recherchée parmi 


les points x de l’ensemble S défini par la condition 
S=SiUSeUSs (6-65) 


et représentant un ensemble fini. Cette règle ramène le problème 
de la recherche de la valeur optimale z* à l’examen du cas précédent 
d'un ensemble fini des solutions admissibles. 


Éremple 6-2. Pour la fonction représentée sur la figure 6-5, on a S, — 
= {rh Se fre), Sa — (a. b 
onc, S$ — {a, ri, Te, 
Exemple 6-3. Soient X = [0, 2], q (x) = É — 2: Etant donné que, sui- 
vant la définition de la valeur absolue d'un y réel, 
f —y pour y<oO; 
[yl= 
Ù y pour y>0, 


q (rx) peut se mettre sous la forme 


L_: pour r< 


g (zx) = ; 
T7 pour zx- 


En dérivant par rapport à z, on a: 


—1 pour r< 
g'(x) = 
+1 pour zx>- 
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Au point x =: {/2 il n’y a pas de dérivée, car les valeurs de q’ (r) au voisi- 
nage de ce point sont différentes à gauche et à droite. On voit donc que sur 
l'intervalle [0, 2] il n’y a pas de valeurs de x pour lesquelles g’ (r) -- 0. De 
cette façon, S, = g. S, — {1/2}, S3 — {0, 2}, tandis que S — {0. 1/2, 2). 

En calculant les valeurs de g (r) pour tous les x € S, on obtient min q(x) — 

x£[0,2 
= 0 pour x == 1/2, max gq (x) = 3/2 pour r — 2. 9] 
xE[ 0.2] 


On remarquera que les valeurs de x € S définissent des minima 


ou des maxima relatifs ou locaux, c.-à-d. des points x de l’ensemble X 
tels que 


y(r)<aq(x) où q(x) >q(x) 


pour tous les x qui sont assez proches de x. Il est vrai que parmi les 


points x € S on peut trouver des points où il n’y a ni maximum rela- 
tif ni minimum relatif (par exemple, les points d’inflexion). Le calcul 


des valeurs de q (x) aux points x = zx € S a pour but de trouver le 
minimum ou le maximum absolu de la fonction qg (x). Dans ce cas, 
la résolution exposée plus haut peut s'avérer assez compliquée si 
le nombre d'éléments de l’ensemble S est élevé et si le calcul de la 
fonction qg (x) n'est pas aisé. 

Pour simplifier la résolution, on diminue le nombre d'éléments 
de l’ensemble S, ce qui s'obtient d'habitude par passage au calcul 
des dérivées de la fonction q (x) au lieu de calculer la fonction elle- 
même (si l'expression des dérivées est plus simple que l'expression 
de la fonction). Dans le même but, on peut utiliser des procédés 
connus dans les mathématiques supérieures et concernant l’élimina- 
tion de certains éléments de l’ensemble S par comparaison des signes 
des dérivées ou par calcul’des dérivées d'ordre supérieur [48]. 


Exemple 6-4. Trouver la valeur de z — z° qui maximise la fonction g (x) = 
— e7*%° sur l'intervalle X = [—1, +1]. l 

A partir de la condition q’ (x) = — 2re *" = 0 on trouve S, == {0}. 
Etant donné que la fonction q (x) est continue, S, = g, Sa — {—1, +1}. 
Ainsi, S = {—1, 0, 1}. 

Essayons maintenant de diminuer le nombre d’éléments de l’ensemble $. 
Vu que 
f 0 pour z<0; 


2@=) 0 pour zx>0, 


on ne peut pas avoir de maximum aux points de l’ensemble S:, tandis que les 
conditions du maximum sont satisfaites pour le point zx — 0. Donc, S’ — 
= S, = {0}, z° — 0, q(z*) = e° = 1. 


L'exemple qui suit est donné pour examiner les difficultés qui 
surgissent lorsque les variables du problème sont exprimées” par 
des nombres entiers. 
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Ce 


Exemple 6-5. Trouver la valeur de i = i * qui maximise la fonction q (i) — 
= 100 à — 3i° sur l'ensemble X = {i € R: i est un entier, 0 < i < 100}. 

Ici, le domaine X des valeurs admissibles de la variable représente un en- 
semble fini. Toutefois, le nombre d'éléments qu’il contient est si grand qu’il 
est difficile de comparer directement les valeurs de q (i) obtenues pour tous les 
éléments de l’ensemble X. Dans des cas pareils, il faut toujours tâcher d'élargir 
le domaine des valeurs admissibles de la variable de façon qu'il représente un 
intervalle continu. On peut, par exemple, substituer à X l’ensemble X, = 
= {z2E€R:0< x < 100}, de sorte que X € X1. Maintenant, si à la place de 
q (i) on construit une nouvelle fonction q, (x) telle que, pour x = i, on a g, (x) = 
= q(i), le problème de la recherche de z* € X qui maximise q (i) peut être 
remplacé par celui de la recherche de r* € X, qui maximise q, (zx). 

Posons dans l'exemple qui nous intéresse g4 (r) = 1UUr — 3z°. Alors, 
S1 = {16,7}, S, = g, Sa — {0; 100}. De cette facon, S — {0; 16,7; 100} 
et z* — 16,7. Mais la valeur z* obtenue n’est pas un élément de l’ensemble X. 
C’est pourquoi la valeur optimale i* doit être recherchée parmi les éléments de 
l’ensemble X voisins de z*. Ainsi, on obtient i* € {16; 17}, d'où l’on trouve 
iv — 17, q{i*) == 833. 


d) Utilisation des formules d’interpolation 


Daus toute une série de cas (par exemple lors de l'optimisation 
des étapes isolées d’un processus à étapes multiples), la fonction 
qg(x) n’est pas donnée par une formule et l’on n'indique que la pro- 
cédure d'obtention des valeurs de q (x). Dans des problèmes pareils, 
il n’est pas possible d'appliquer les méthodes analytiques décrites 
dans la division précédente, et pour pouvoir juger du caractère 
de la fonction gq (x), il faut trouver toutes les valeurs qu’elle prend 


sur l'intervalle X — [a, b] des valeurs admissibles de la variable. 
Etant donné qu'il est impossible de dresser un tableau complet 
des valeurs de la fonction q (x), on calcule qg (x) pour un certain sous- 


ensemble fini X de l’ensemble X pour utiliser ensuite les résultats 
obtenus dans le but d'étudier le comportement de cette fonction 
sur tout l'intervalle [a, b]. Cette procédure s’appelle interpolation 
de la fonction g (x). Sans nous attarder sur les questions générales 
de la théorie de l’interpolation [49], nous nous limiterons à exa- 
miner une des formules d’interpolation les plus répandues appelée 
formule de Newton. 

Supposons que l’on ait pris sur l'intervalle {a, b] r + 1 valeurs 


discrètes équidistantes de x constituant l'ensemble X — {x, = a, 
Lis + + Tn = 0}, avec x; — ro + iô, i — 0, 1,..., n, où 6 re- 
présente l'intervalle qui sépare deux valeurs discrètes voisines. 


Supposons les valeurs de g (x) pour x € X calculées et égales à 
y; = q(au), i = 0, 1, ..., n. L'’interpolation consiste dans le 
choix d’un polynôme p (x) de degré non supérieur à n, qui prend 
aux points z = z; les valeurs p (z;) = y. Les valeurs de ce polynôme 
pour tout x € [a, b] sont prises en tant que valeurs de q (x). 
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Ecrivons le polynôme p (x) sous la forme 
P(x) = 40 +41 (rx —Zo) + a2 (x — To) (x — Zi) + 
+ a3(xz— 2x0) (tr — 2) (Z — 22) +... Fan (ZT —Zo) (T— x)... (z— rn-1). 
(6-66) 
Définissons les coefficients ay, a, . . ., a, de façon que 


P (to) = Yos P (21) = Yas + ++, P (Æn) = Yn- 


En portant successivement dans (6-66) à la place de zx les valeurs 
Lo Tir + + + Zn, On obtient : 


Yo — Ag OÙ Lo —WYo;, 


9 


Yi == do + Ai (Ti — Lo) = Yo + A0 ou ay= ; 
Ye = Qo + Gi (le — Lo) + Az (Ta — Lo) (Le — 1) :- 
» — 2 
= ÿo + 2(Yi—Yo) + 20*a: ou a: = hu, 

Ce processus de calcul successif des coefficients peut être pour- 
suivi. 

Pour réaliser l’écriture la plus commode des coefficients, il est 
rationnel d'introduire les désignations spéciales pour les différences 
des valeurs prises par la fonction. On appelle différences premières 
les quantités 

AY = Ynxa—Yn, k=O0, 1,...,n—1. 

Les différences des différences premières sont appelées diffé- 
rences secondes et se notent : 

Ayr = Ayres — Ayr = Ynre — 2Yr+s +Yn. 

D'une façon analogue on introduit les différences troisièmes, qua- 
trièmes, etc. Par exemple, 

Nyn = M'ynss — Ayn = Yn4s — Bynre + BYnei — Ye 


Compte tenu de ces désignations, les formules des coefficients 
prennent la forme 


Ayo . Ayo . A" yo 
do — Yo : Us: do = 918 * °°°? An Ton * 


Substituant ces valeurs dans la formule (6-66), on obtient la 
formule d'’interpolation de Newton: 
LT —TQ 


q (a) & p (x) = Yo + Au . ) +22 (=) (= +... 


+ Me (2e) (2H) (Eat), (6-67) 


n! 
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D'habitude, cette formule s'écrit d’une façon différente, en posant 
—=u ou = 70+0u. (6-68) 
Compte tenu de (6-68), la formule de Newton prend la forme 


_1),, 
q (à)  p (xo + ôu) = yo + uAyo+ ! Ayo+ 


+ u(u—1)(u—2) ... (u—nr+1) Ayo. (6-69) 


n ! 


Dans certains cas, l’interpolation est commode à réaliser à l’aide 
de la formule 


ORDER Ft (6-70) 
j=0  i=0 
i#) 


Il est évident que cette formule est vraie tout d’abord parce qu'’el- 
le-représente un polynôme en z; d’autre part, pour z = 2;, À — 
= 0, 4,..., n, les valeurs de p (zx) sont égales à y4. 
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CHAPITRE 7 


PROGRAMMATION LINÉAIRE 


7-1. POSITION DU PROBLÈME DE RROGRAMMATION LINÉAIRE 


a) Définitions principales 


Au chapitre 6 on a déjà indiqué que le terme « programmation 
linéaire » se rapporte à l’étude et à la résolution du problème sui- 
vant [50 à 53]. : 

Soit un système de m équations linéairement indépendantes à 
ñn inconnues zy, - - «+» Zn appelé système de contraintes du problème 
de programmation linéaire : 

ŒyTi + . + AynTn = 0; | 


- 1-1 
AmiLs + ++ + Amnn = Üm. À 


Le problème donné est caractérisé par le fait que le nombre 
d'équations est inférieur au nombre d’inconnues, c.-à-d. m < n. 
On demande de trouver les valeurs non négatives des variables 
(1 > 0, i — 1,..., n) qui vérifient les équations (7-1) et mini- 
misent la fonction objectif 


Q = Co + CZ +... + Cnlns (7-2) 


appelée souvent forme linéaire. 

Donnons quelques explications concernant ce problème. Sile nom- 
bre d'équations est égal au nombre d'’inconnues (m—n), le système 
d'équations (7-1) est examiné dans l'algèbre ordinaire. Si, dans 
ce cas, le déterminant du système n'est pas nul, la solution est unique 
et on la trouve par des procédés bien étudiés. Mais si le nombre 
d'équations est inférieur au nombre d’inconnues (m << n), le système 
d'équations (7-1) possède une infinité de solutions et on a une infi- 
nité de collections de variables x; (i — 1, ..., n) qui vérifient les 
équations (7-1). Chaque collection de variables x; (i = 1, ..., n) 
satisfaisant au système d'équations (7-1) sera appelée solution. 

Mais aux variables x; on impose une contrainte supplémentaire 
en vertu de laquelle ces variables doivent être non négatives (x; > 0). 
Dans le cas général, il y a une infinité de solutions satisfaisant à 
cette condition supplémentaire. Toute solution du système (7-1) 
comportant des valeurs non négatives des variables sera appelée 
solution admissible. Ainsi, l'essence du problème de programmation 
linéaire consiste à choisir dans la collection de solutions admissibles 
celle qui minimise la forme linéaire (7-2). 
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Parfois, on rencontre des problèmes de programmation linéaire 
dont toutes ou une partie des équations du type (7-1) se présentent 
sous la forme d'inégalités. Ainsi, à la place de l'équation 


Gti +. + Gintn =D; (7-3) 
le système (7-1) peut contenir une inégalité de la forme 

GjiTi + ++ + Gjntn D) ” (7-4) 
ou 

Gjitit -.. +aintn > 0). (7-5) 


Toutefois, ces inégalités sont sans difficulté mises sous forme 
d'équations par l'introduction d'une variable additionnelle 
Zn+; > 0 de façon que l’une des deux expressions ci-après ait lieu 
en fonction du sens de l'inégalité : 


ajiln + …. + Gjntn + Tn+j =); | 
ajiln + .. + GjnTn — Tn+j = 0j. 


Cette transformation ne fait qu’augmenter le nombre de varia- 
bles, ce qui ne change pas l’essence du problème. 

Parfois, on ne demande pas de minimiser la forme linéaire (7-2) 
mais de la maximiser. Ce problème est ramené au problème précédent 
en inversant le signe de l'expression de g. Vu que dans ce qui suit 
on rencontrera des problèmes des deux types, convenons de désigner 
la valeur de la fonction objectif par qg s’il faut la minimiser, et par 
qg' s’il s’agit de sa maximisation. 

Avant de chercher la solution des équations (7-1), satisfaisant 
à toutes les exigences imposées (x; > 0, i —1, ..., n; q — min), 
essayons de trouver une solution quelconque de ces équations. Etant 
donné que le nombre de variables r de ce système est supérieur au 
nombre d'équations m, on peut trouver une des solutions possibles 
en égalant à zéro rz — m variables quelconques. On obtient ainsi 
un système de m équations à m inconnues qui peut être résolu par 
des méthodes ordinaires connues de l'algèbre. 11 est vrai que, pour 
que le système de m équations à m inconnues admette une solution, 
le déterminant composé à partir des coefficients des inconnues ne 
doit pas être nul. Si cette condition n'est pas satisfaite, on peut 
égaler à zéro autres z — m variables. La solution obtenue de cette 
façon est appelée solution de base. On peut maintenant introduire 
certains termes largement utilisés dans les problèmes de programma- 
tion linéaire. 

On appelle base toute collection de m variables telles que le 
déterminant composé de leurs coefficients ne soit nas nul. Ces m 
variables sont dites variables de base (par rapport à la base donnée). 
Les n — m variables restantes sont des variables libres (ou secondai- 
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(7-6) 
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res). Chaque système d'équations (7-1) concret peut avoir plusieurs 
bases différentes dont chacune contient ses variables de base. 

Si l'on suppose nulles toutes les variables libres et si l’on résout 
le système de m équations à m inconnues ainsi obtenu, on aboutit 
à une solution de base. Toutefois, parmi les différentes solutions de 
base on trouvera des solutions qui donnent des valeurs négatives 
de certaines variables. Ces solutions de base sont en contradiction 
avec les données du problème, donc elles sont inadmissibles. 

Une solution de base admissible est une solution de base qui en 
même temps est admissible, c.-à-d. donne des valeurs non négatives 
des variables de base. Les solutions de base admissibles sont les 
plus simples parmi les solutions admissibles du système (7-1). Mais 
une condition supplémentaire est imposée à la solution du problème: 
la forme linéaire (7-2) doit atteindre son minimum pour la solution 
trouvée. Compte tenu de cette condition supplémentaire, on voit 
que la résolution du problème devient plus compliquée, mais, toute- 
fois, la notion de solution de base admissible joue aussi un rôle très 
important lors de la recherche de la solution complète du problème. 


b) Exemples de problèmes de programmation linéaire 


La programmation linéaire a pris naissance lorsqu'on s’est pro- 
posé de trouver les variantes les plus avantageuses de résolution 
des différents problèmes liés à la planification et à la production. 
Ces problèmes se caractérisent par une grande liberté de variation 
des différents paramètres et par une série de contraintes. On demande 
de trouver des valeurs des paramètres telles qu’à un certain point 
de vue elles soient les meilleures. Ces problèmes concernent la recher- 
che du plus rationnel mode d'utilisation des matières premières et 
des matériaux, la détermination des régimes de production les plus 
avantageux, l'augmentation de l'efficacité des moyens de transport, 
etc. Si la commande de la production est automatisée, ces problèmes 
doivent être résolus automatiquement et continüment. Pour cette 
raison la connaissance des méthodes de résolution de ces problèmes 
est nécessaire à n'importe quel ingénieur et devient particulière- 
ment importante pour un spécialiste de l’automation. 

Les exemples qui vont suivre nous permettront d'illustrer l’es- 
sence des problèmes de programmation linéaire. 


Exemple 7-1. Problème d'utilisation des ressources. Pour réaliser L processus 
technologiques différents T;, ..., Ty, une usine a besoin de m genres de res- 
sources Sy, + +» Sm (matières premières, combustible, matériaux, outillage, 
etc.). Les réserves de chaque genre de ces ressources sont limitées et sont égales 
à b,,..., bm. On connaît la consommation des ressources par unité de produc- 
tion pour chaque processus technologique. Déterminer le volume de chaque type 
de production pour que le profit apporté par la réalisation de cette production 
‘soit maximal. 
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Désignons par a;; la consommation de ressources du genre S, par unité de 

production du type 7j, et par c; le profit apporté par la réalisation d’une unité 

e production du type T;. Toutes les données dont on dispose sont concentrées 
dans le tableau 7-1, où, pour concrétiser, l’on pose ! = 3 et m = 4. 


Tableau 7-1 


Systématisation des données initiales du problème 
d'utilisation des ressources 


Consommation de ressources 
par unité de production Réserves 


Genre de ressources 


S0 
Ti T2 T: urces 
Si di &yo ay3 bi 
Se @1 de Ge3 ba 
S3 ag age a33 bs 
Se a,{ Gye ay3 b, 
Profit par unité de pro- C{ 


duction réalisée 


o 
to 

Lu 
oo 


Désignons par z; le nombre d'unités de production du type 7’; fabriquées. 
Les contraintes de ce problème imposent que la consommation des ressources 
du genre S; (i = 1,..., m) pour la fabrication de tous les types de production 
ne dépasse pas les réserves disponibles: 


l 
D ajty Lbi,. 1—=1,..., me (7-7) 
3=1 
11 est aisé de transformer ces contraintes en équations en introduisant les 


variables x,,; > 0 qui représentent les ressources non utilisées du genre S;. 
De cette façon, au lieu de (7-7) on obtient: 


l 
2 ayjzj—zisi=di, 1=1,...,m. (7-8) 
j=1 
Le profit que donne la réalisation de la production sera 
l 
g = ÿ CjT j- (7-9) 
j=1 


Le plan de fabrication optimal sera donné par la solution non negative du 
système d'équations (7-8) pour laquelle la fonction objectif (7-9) sera maximale. 

Exemple 7-2. Problème de répartition de la fabrication entre plusieurs 
entreprises. Le plan de la branche prévoit la fabrication durant la période 7 des 
types de production suivants: 


À; + \, pieces ; 
Ann mm + + + + «Vs pièces; 


À; . ee + LILI III II... . Nr pièces. 
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Ces types de production peuvent être fabriqués par r entreprises homogènes 
E;, ..., E,. Supposons qu'aucune entreprise ne soit en état de fabriquer plu- 
sieurs types de production à la fois. On donne en outre: 

a;; est la quantité de la production À, fabriquée par l'entreprise E; par 
unité de temps; 

b;;, le coût de l'unité de production du type 4; fabriquée par l'entrepri- 
se E;; 
3 1, la période durant laquelle l’entreprise £; fabrique de la production 4. 
Trouver les valeurs de z;; assurant le coût minimal de la production. 
Contraintes : 
1) le temps de travail de chaque entreprise ne doit pas dépasser T 


l 
Dry <T, j=d,...r; (7-10) 
i=1 : 


2) la quantité de production doit correspondre à la nomenclature 


r 
> aijtiÿ = N;, i=1, ...) . (7-11) 
j=1 


La fonction objectif représentera le coût total de la production fabriquée. 
Tenant compte du fait que la quantité a;;b;;r,; représente le coût de la partie 
de production À; fabriquée par l’entreprise £;, on voit que le coût total de la 
production fabriquée sera 


CE 
g= ÿ ÿ a;jb;jti;. (7-12) 
j=1 1=1 


Conformément aux données du problème, cette quantité doit être minimisée 
en respectant les contraintes (7-10) et (7-11). 

Exemple 7-3. Problème de transport. Aux points P,, ..., P, se trouvent 
les charges homogènes en quantités a,, . . ., ay. Les quantités b,, ..., b, de ces 
charges doivent etre transportées aux points @,, ..., Q, de façon que le coût 
total du transport soit minimal, en supposant que les charges à transporter sont 
égales aux stocks dont on dispose 


u 
2 = ÿ) bje (7-13) 


3=1 


Désignons par x;; la charge transportée de P; à Qj'et par c;; le coût du trans- 
port de l'unité de cette charge. Les contraintes imposées sont les suivantes : 

1) la charge expédiée du] point P,; en tous les points de destination doit 
être égale aux stocks a; dont on dispose : 


r 
à Zij= ai, i=1,...,1; (7-14) 
=1 


2) la charge arrivée à Q; en provenance de tous les points d’expédition doit 
être égale à la quantité requise b;: 
l 


ÿ zi=d;, j=1,...,r, (7-15) 
1—1 
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La fonction objectif définit le coût total du transport de toutes les charges 
qg= D > CijTif- (7-16) 


Exemple 7-4. Problème du choix de l'appareillage correspondant à la variante 
optimale. On demande de projeter une calculatrice numérique capable d’effec- 
tuer successivement r opérations mathématiques. Elle doit donc comprendre r 
blocs disposés en série. Chacun de ces blocs peut être réalisé en une de 
l versions possibles: à tubes électroniques, à éléments semi-conducteurs, 
à transistors et noyaux de ferrite, à micromodules, etc. Les contraintes 
imposées concernent le coût maximal (X), les cotes d'encombrement maxima- 
les (Y) et le temps maximal des opérations (Z). Choisir la variante la plus avan- 
tageuse en ce qui concerne les exigences formulées. 

Désignons respectivement par r;, y; et z; le coût, l'encombrement et la 
durée de l'opération de l'i-ème bloc. Alors, les contraintes peuvent s'écrire 


T r T 
Su<xX, Dn<Y D u<2 (7-17) 
im 1=1 1=1 


Les grandeurs z;, y, et z; sont fonction de la version du bloc, donc elles 
sont des éléments des ensembles suivants: 


24 EC Tias co Zu} VE (yiss cos Yu s 21 € (Zits cos Zit} (7-18) 


où ;;, Yi 213 désignent respectivement le coût, l'encombrement et la durée de 


# 


l'opération de l’i-ème bloc exécuté en la j-ième version. 


Si cy, Ca et cs sont des coefficients qui caractérisent la valeur relative de la 
diminution du coût, de l'encombrement et de la durée d’une opération, la con- 
dition qui définit la variante optimale de l’appareillage va s'écrire 


T LE T 
q=c D site D vibes D; a =min. (7-19) 
i=1 i=1 


i=1 


Le présent problème diffère du problème de programmation linéaire formu- 
lé au début de ce chapitre par le fait que les variables z;,, y,;, z, ne peuvent pas 
rendre n'importe quelles valeurs non négatives mais seulement des valeurs 
aisant partie des ensembles finis (7-18), bien que les contraintes (7-17) et la 
fonction objectif (7-19) soient linéaires. C’est pourquoi les méthodes ordinaires 
de la programmation linéaire ne sont pas applicables au problème en question 
et il faut recourir aux méthodes de la programmation en nombres entiers (ou 
programmation discrète). 


c) Interprétation géométrique 
du problème de programmation linéaire 


Pour se faire une idée plus complète du problème de programma- 
tion linéaire, on donne ci-dessous l'interprétation géométrique d’un 
problème de ce type. Soient donnés le système d'équations 

— 271422 +zs=2; 
Li — PAR + zx, —= 2 : (7-20) 
Ti+ Te + =09 
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et la fonction objectif 
Q = La — Ti. (1-21) 


On demande de trouver les valeurs non négatives des variables 
vérifiant les équations (7-20) et minimisant la fonction objectif 
(7-21). Il s'avère plus commode de donner les règles de résolution du 
problème de programmation linéaire pour le cas où il faut maximiser 
la fonction objectif et, pour cela, prenons en qualité de fonction 
objectif l'expression 


g'=—qQ=Ti— Ta (7-22) 


Dans l'exemple considéré, le nombre d'équations m = 3 et le 
nombre d’inconnues r = 5, de sorte que l’on a m = 3 variables de 
base et nr — m —2 variables libres. Le fait d’avoir seule- 
ment deux variables libres nous permet d'illustrer la solution 
géométrique du problème dans un espace à deux dimensions, donc 
dans le plan. 

Le système de trois équations (7-20) peut être résolu par rapport 
à trois variables, par exemple, par rapport à z,, x, et x; en les expri- 
mant par l'intermédiaire de zx, et z.. Ainsi on obtient: 


T3= 2+2Ti— Ze; 
Ty = 2—T1+ 2Te; (7-23) 


D'après les données du problème de programmation linéaire, 
les variables peuvent prendre seulement des valeurs non négatives, 
ce qui signifie que le domaine des valeurs admissibles des variables 
sera déterminé par les conditions 


mn >0 i—=1,2,3,64,5. (7-24) 


Chacune des inégalités (7-24) définit un certain demi-plan dans 
le plan (x,, z,). Ainsi, l’inégalité x; > 0 définit le demi-plan supé- 
rieur, tandis que l'inégalité x, > 0 définit le demi-plan situé d'un 
côté de la droite 2 + 2x, -- x, — 0 et notamment celui qui contient 
l'origine des coordonnées, ce que l’on vérifie facilement en substi- 
tuant dans la première des inégalités (7-23) les coordonnées du point 
(0, 0). Le domaine correspondant à xs << 0 est interdit et sur la 
figure 7-1 il est marqué par la hachure. 

Sur la figure 7-2 sont représentées les constructions analogues 
exécutées pour tous les x;. Les droites correspondant à la condition 
z = O(i = 1, 2, 3, 4, 5) y sont marquées du chiffre (i). Les domai- 
nes interdits correspondant à x; < O0 sont marqués par la hachure. 
De la figure 7-2 on voit que le domaine des valeurs admissibles des 
variables x, et x, est représenté par le polygone Oabcd (figurant 
ici en grisé). Il importe de remarquer que le polygone des solutions 
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admissibles est convexe, car il représente l'intersection des domaines: 
convexes définis par les conditions x; > (. 

La construction effectuée permet de donner une interprétation 
géométrique de la solution de base. Etant donné que chaque droite. 
de la figure 7-2 correspond à l'annulation de l’une des variables, 
aux points d'intersection de deux droites on verra s’annuler deux, 


Fig. 7-2. Polygone ces solutions 
admissibles 


c.-à-d. r — m variables. Mais 7 — m représente le nombre de varia- 
bles libres dont l’annulation correspond à une solution de base. Ainsi, 
les points d’intersection des droites x; — O (i — 1, ..., 5) défi- 
nissent les solutions de base du problème de programmation linéaire. 

Parmi les solutions de base il y en a qui n’appartiennent pas au 
domaine des solutions admissibles. Ce sont des solutions de base 
inadmissibles. Seulement les points d'intersection des droites 
zx = Ô qui sont en même temps sommets du polygone des solutions 
admissibles appartiennent au domaine des solutions admissibles. 
Il s'ensuit que les sommets du polygone des solutions admissibles 
correspondent aux solutions de base admissibles. 

Examinons maintenant les conditions qui assurent la maximisa- 
tion de la fonction objectif (7-22). Au point de vue géométrique, 
pour tout g”, l'expression (7-22) définit une droite tracée sous un 
angle de 45° à l’axe des abscisses, l'augmentation de g’ entraînant 
le déplacement de la droite dans le sens indiqué par la flèche visible 
sur la figure 7-2. Cette droite ne sera compatible avec la solution 
admissible du problème que dans le cas où elle a des points communs 
avec le domaine des solutions admissibles. La valeur maximale de 
g' sera atteinte pour la position extrême de la droite lorsque celle-ci 
se transforme en droite d'appui au domaine des solutions admissibles 
(ligne en trait interrompu sur la figure 7-2). Mais la droite d'appui 
à un polygone convexe passe obligatoirement par au moins un de 
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ses sommets qui, comme on l’a déjà vu, correspondent aux solutions 
de base admissibles. 

On arrive ainsi à une conclusion très importante: la solution du 
problème de programmation linéaire qui maximise la fonction objec- 
tif g se trouve obligatoirement parmi les solutions de base admis- 
sibles. 

Cette conclusion est facilement généralisée au cas où m et nr sont 
arbitraires et nr — m > 2. Dans ce cas, les conditions x; > 0 (i — 
— 1, ..., n) définissent des demi-espaces dans un espace multidi- 
mensionnel, dont l'intersection définit le domaine des solutions 
admissibles sous la forme d’un polyèdre convexe. Les sommets de ce 
dernier correspondront aux solutions de base admissibles. L'expression 
de la fonction objectif définit un hyperplan dans l'espace multidi- 
mensionnel considéré qui, pour g” — max, sera un hyperplan d'appui 
au polyèdre des solutions admissibles, ce qui signifie qu'il passera 
nécessairement par au moins un de ses sommets. De cette façon, 
dans ce cas aussi, la solution du problème de programmation linéaire 
se trouvera parmi les solutions de base admissibles. 

La conclusion à laquelle on est arrivé permet de tracer la voie 
menant à la solution du problème de programmation linéaire. Etant 
donné que la solution doit se trouver parmi les solutions de base 
admissibles dont le nombre est fini, on peut trouver toutes les solu- 
tions de base admissibles et calculer pour chacune d’entre elles la 
valeur de gq’. Finalement, la solution recherchée sera celle pour 
laquelle la valeur de q’ sera maximale. 

Bien que possible, cette voie de résolution du problème est 
difficile, car le nombre de solutions de base admissibles peut être 
considérable. Toutefois, il y a des méthodes rationnelles de triage 
successif des solutions de base qui permettent de ne pas considérer 
toutes les solutions de base admissibles mais seulement un nombre 
minimal d’entre elles. Une des méthodes de triage les plus répandues 
est la méthode dite du simplexe qui sera examinée dans le para- 
graphe qui suit. 
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a) Algèbre de la méthode du simplexe 


L'essentiel de la méthode du simplexe consiste en ce qui suit. 
On trouve tout d’abord une solution de base admissible quelconque. 
Cette solution peut être trouvée en supposant libres et égales à zéro 
n — m variables et en résolvant le système d'équations (7-1) ainsi 
obtenu. Si certaines des variables de base s’avèrent: négatives, il 
faut choisir d’autres variables libres, c.-à-d. passer à une nouvelle 
base. 
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Après avoir trouvé cette solution de base admissible, il faut voir 
si la fonction objectif q” n’a pas encore atteint son maximum. Sinon, 
on recherche une nouvelle solution de base admissible en allant 
dans le sens d'augmentation de la valeur de la fonction objectif q'. 
Ensuite, la procédure est réitérée. Etant donné que la nouvelle solu- 
tion de base admissible est choisie de façon à augmenter la valeur 
de la fonction objectif, la méthode en question permet de considérer 
un nombre minimal de solutions de base admissibles et aboutit rapide- 
ment à la solution finale. Analysons cette méthode plus en détail 
en l’appliquant à l'exemple précédemment cité. 

Considérons le système d'équations (7-20) pour lequel il faut 
trouver une solution non négative qui maximise la fonction objectif 
(7-22). Vu que z — m — 2, on peut prendre en tant que variables 
libres n'importe quel couple de variables, par exemple, x, et 22. 
En égalant à zéro ces deux variables, on a, à partir de (7-20), la 
solution de base x, — Te = 0, zx; = 2, ra = 2, xs — 5 qui est ad- 
missible et qui donne q = T1 — To = (. 

Il nous intéresse maintenant de voir si cette solution rend maxi- 
male la fonction objectif. A cette fin, on peut chercher une nouvelle 
solution de base pour laquelle la fonction objectif ait une valeur 
plus grande. Pour passer à une nouvelle solution de base admissible, 
une des variables libres (x, ou z,) doit être prise en tant que variable 
de base. Dans ce cas, elle sera différente de zéro, ce qui signifie qu’el- 
le augmentera. Il s'ensuit que si une quelconque des variables libres 
figure avec le signe « + » dans l'expression de la fonction objectif 
(ce qui veut dire que la fonction objectif augmente avec l’augmenta- 
tion de cette variable), le maximum de la fonction objectif n'est 
pas atteint et la variable en question doit être prise comme variable 
de base différente de zéro. 

Mais lorsque la variable libre s'accroît, certaines variables de 
base commenceront à diminuer. Les valeurs négatives des variables 
étant inadmissibles, il faut prendre en qualité de nouvelle variable 
libre celle des variables de base qui s’annule avant toutes les autres. 

Dans l'exemple considéré, l'expression de la fonction objectif 
(7-22) contient la variable libre x, avec le signe « + ». Donc, le 
maximum de la fonction objectif n’est pas atteint et la variable x, 
doit être transformée en variable de base. Pour déterminer la nouvel- 
le variable libre, exprimons les variables de base z., x,, x; en fonc- 
tion des variables libres en ramenant les équations (7-20) à la 
forme (7-23). Ces équations montrent que, pour z, — 0, l’augmen- 
tation de x, n'entraîne pas la diminution de x; mais fait diminuer 
z, et x;, de façon que, pour 7, = 2,onaz; = 0, xs — 3 > (0. Donc, 
la variable z, doit être prise comme variable libre, ce qui nous amène 
à la nouvelle base z;, za, xs. 

Pour continuer la résolution du problème, il faut résoudre le 
système (7-20) par rapport aux nouvelles variables de base en le 
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mettant sous la forme 
Z1=2+ 27e — ZX, ; 
Z3=0+ 317; — 2x; (7-25) 
ZT; —= 3 — JLo + Te. 


Exprimons également la fonction objectif en fonction des nouvel- 
les variables libres x, et x, : 


q' rs 2 -L Lo — Li. (7-26) 


Par des raisonnements analogues on arrive à la conclusion que le 
maximum de la fonction objectif n’est pas atteint et qu'il faut trans- 
former la variable libre x, en variable de base et la variable de base x; 
en variable libre. Dans ce cas, la nouvelle base comportera les varia- 
bles z1, Zo, Ts. 

En résolvant les équations (7-20) par rapport aux nouvelles 
variables de base, on obtient: 


m4 23: 


3 3 
TE: (7-27) 


Ts=I— Ti — 2%; 
et la fonction objectif prend la forme: 


q =3— _ TL, — _ Lg. (7-28) 

L'expression (7-28) montre que l’augmentation des variables 

libres x, et x; entraîne la diminution de la valeur de q’. Ils’ensuit 

que, pour la base donnée, la fonction objectif g’ atteint son maximum 

et la solution du problème considéré est fournie par la collection de 
variables suivante: 


Za= Is = 0, 2 —=4, x = 1, 2,3 =9. 


Dans ce cas, g” = —q — 3, q = —3. 

La méthode de résolution examinée implique des transformations 
encombrantes du système d'équations linéaires, ce qui constitue 
son principal inconvénient. Ces transformations peuvent être sim- 
plifiées pour beaucoup en mettant les équations sous la forme des 
tableaux contenant les coefficients des variables. Cela permet de 
passer d’un système d'équations à un autre en recalculant tout sim- 
plement les coefficients portés aux tableaux suivant des règles 
purement formelles qui, d’autre part, se prêtent bien à l’utilisation 
des calculatrices électroniques. 


\ 
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b) Méthode du tableau du simplexe : 
recherche de la solution optimale 


Lors de la mise en œuvre de cette méthode, il est commode d'’uti- 
liser une forme spéciale d'écriture des équations (7-1) et de la fonc- 
tion objectif (7-2). Désignons par ti, i — 1, ..., m, les variables 
de base et par z5, j — 1, ..., (7 — m) les variables libres. En 
exprimant la fonction objectif et les variables de base en fonction 
des variables libres, formulons le problème de programmation linéai- 
re de la façon suivante: 

Il faut maximiser 

n-mMm 


q = —q—=@0— à ŒojT} (7-29) 


sous les contraintes 
n-m 


Ti = — à ts, =1,...,m; 220; zx52>0. (1-30) 
2= 
Cette écriture permet de présenter le problème sous la forme de la 
matrice suivante des coefficients des variables: 


1— 7 CCE — Lim 


’ 


g ÆooZ01 --- Lon-m) 
Li [Lio 11 + - + Æicn-m) (7-31) 
Tin Xrn0Xm1 ... Œmin-m) 


La forme des coefficients de la matrice (7-31) permet d'apprécier 
sans difficulté si la solution de base trouvée est admissible, et, dans 
l’affirmative, si elle est optimale. En effet, on remarque que la 
colonne des coefficients Œios i Æ 0, représente la solution de base 
correspondant à la base x, . .., zn, et que la ligne des coefficients 
or j = O, est composée des coefficients changés de signe des varia- 
bles libres figurant dans l'expression de gq', ce qui permet de tirer Ja 
conclusion que la solution de base correspondant à à la base Zp ... Tn 
est admissible si &;, > 0, i 0. Si en outre «,; > 0, j 0, cette 
solution de base est en même temps la solution optimale. T1 est 
aussi évident que, pour la solution de asc optimale, le coefficient 
oo donne la valeur de q” = Qnax — — Qm 

Commençons la résolution du problème en trouvant une solution 
de base admissible quelconque qui, dans le cas général, n’est pas 
optimale. Présentons cette solution de base sous la forme d’un ta- 
bleau de coefficients analogue à la matrice (7-31). Pour passer à une 
meilleure solution de base, il faut remanier la matrice des coeffi- 
cients. Formulons le procédé permettant d'effectuer cette transfor- 
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mation sous la forme d’un système de règles que nous allons illustrer 
à l’aide du problème résolu au paragraphe précédent. Sans donner 
une argumentation rigoureuse à ces règles, on remarquera qu'elles 
correspondent strictement aux transformations du système d'’équa- 
tions effectuées dans l'exemple précédent et qui sont faciles à véri- 
fier par confrontation des transformations correspondantes. 
Supposons que le problème de programmation linéaire soit donné 
sous la forme du système d'équations (7-20) et de la fonction objectif 
(7-22) qu’il faut maximiser. En prenant z, et x, comme variables 
libres, ramenons ce système d'équations et la fonction objectif à la 
forme (7-29) et (7-30) 
g =0—(—z;+ 20); 
Ty =2—(—271+ 22) ; 
Ty = 2— (T1 — 222) ; 
Tr = D — (71 + Le). 
La matrice des coefficients est donnée sous la forme du tableau 
7-2, a dont les cases sont assez grandes pour permettre de porter 


dans leur coin de gauche supérieur les coefficients «;,; des équa- 
tions (7-32). 


(7-32) 


Tableau 7-2 


Transformations successives des tableaux des coefficients 
lors de la résolution du problème de programmation linéaire 


CE TT 
a Se es 
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Voyons si l’on n’a pas encore trouvé la solution optimale véri- 
fiant la condition &; > 0, j 0. Etant donné que «&,, (le coeffi- 
cient de —z, dans l'expression de q’) est négatif, on constate que la 
solution optimale n’est pas trouvée et la variable x, doit être trans- 
formée en variable de base. Mettons en évidence la colonne de la 
variable x, à l’aide des barres verticales doubles. Si les coefficients 
0; de plusieurs variables libres s'avèrent négatifs, n'importe quelle 
de ces variables peut être transformée en variable de base. 

Déterminons maintenant la variable de base qui doit être trans- 
formée en variable libre. Ce sera évidemment la variable qui s’annu- 
lera plus tôt avec l'accroissement de z,, donc la variable de base z; 
pour laquelle le coefficient situé dans la colonne mise en évidence 
Gi >> 0 et le rapport &;9/@&;, est minimal. La variable de base x, 
avec ao — Z et œu = À vérifie ces conditions. La ligne correspon- 
dant à la variable de base zx, est également marquée par des barres 
horizontales doubles. 

Appelons coefficient général (pivot) le coefficient À = au se 
trouvant au coin de gauche supérieur de la case à l'intersection de 
la ligne et de la colonne marquées. Dans le cas traité, À = 1 (valeur 
encadrée sur le tableau). 

Maintenant, il faut remplir les coins inférieurs des cases en sui- 
vant les règles ci-dessous : 

1) dans la case se trouvant à l'intersection de la ligne et de la 
colonne marquées, on écrit 1/4: 

2) dans les cases de la ligne marquée, on écrit les coefficients 
supérieurs multipliés par À (les coefficients supérieurs, excepté le 
pivot, sont écrits en caractères gras); 

3) dans les cases de la colonne marquée, on écrit les coefficients 
supérieurs multipliés par —À (les coefficients inférieurs, à l'exception 
de la case contenant le pivot, sont donnés en caractères gras) ; 

4) dans les autres cases, on écrit le produit des coefficients écrits 
en caractères gras et figurant dans la colonne et dans la ligne à l’in- 
tersection desquelles se trouve la case donnée. 

Ensuite, on commence à dresser le tableau 7-2, b qui diffère du 
tableau 7-2, a par le fait que la variable libre marquée zx, est devenue 
variable de base, tandis que la variable de base marquée x, est deve- 
nue variable libre. Les coins de gauche supérieurs des cases du ta- 
bleau 7-2, b sont remplis en respectant les règles suivantes: 

1) dans la ligne et la colonne correspondant aux nouvelles varia- 
bles libre et de base, on porte les coefficients inférieurs de la ligneet 
de la colonne marquées du tableau 7-2, a; 

2) dans les autres cases, on écrit les sommes des coefficients se 
trouvant dans les cases correspondantes du tableau 7-2, a. 

Le tableau 7-2, b dressé de cette façon correspond à la matrice des 
coefficients (7-31), la nouvelle base étant zx,, x;, z:. Ensuite, la 
procédure est réitérée. 
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Vu que dans le tableau 7-2, b le coefficient &,, << 0, la solu- 
tion optimale n'est pas trouvée, ce qui signifie qu'il faut remplir 
les coins de gauche inférieurs de ce tableau suivant les règles déja 
données et passer au nouveau tableau 7-2, c correspondant à la base 
Zi, Le, Ts. Dans ce dernier, les coefficients &,y, j 5 0, sont positifs 
et on obtient la solution optimale du problème suivant la colonne 
des termes constants: 


ZX, =4; Za=1Â; za =; Zy = Ts =0; {max —= 


= —min=9; min = —3d. 


€) Problème dual de programmation linéaire 


Revenons au problème de la distribution des ressources examiné à 
l'exemple 7-1 et demandons-nous quelle est, au point de vue de 
l’entreprise, la valeur des ressources dont celle-ci dispose. En résol- 
vant cette question, il faut avoir en vue que les ressources qui ne 
peuvent pas être utilisées à fond n'ont pour l’entreprise que peu 
de valeur et pour en augmenter les réserves elle ne sera pas disposée 
d'engager des frais ne serait-ce que peu importants. Ainsi, un équi- 
pement coûteux non utilisé dans le processus technologique présente 
peu de valeur pour l’entreprise. Les ressources de la majeure valeur 
seront celles qui limitent le plus la production, donc les profits de 
l’entreprise. Pour augmenter les réserves de ces ressources l’entrepri- 
se est prête à assumer des frais considérables. 

C'est pourquoi on peut considérer que chaque type de ressources 
possède un «prix fictif » [10] qui détermine la valeur présentée 
pour l’entreprise par le type de ressources donné au point de vue des 
profits apportés par la réalisation de la production. Ce prix fictif 
dépend des réserves disponibles de ces ressources et de leur utilité 
pour la production. 

Si, pour une raison ou une autre, l’entreprise borne son activité 
à un seul processus technologique nécessitant une consommation 
importante d’un certain type de ressources dont les réserves sont 
limitées, le prix fictif de ce type de ressources sera élevé. Mais les 
prix fictifs établis conformément à ce processus technologique ne 
seront pas les meilleurs, car en mettant en œuvre d’autres processus 
technologiques, on arrive à une utilisation plus rationnelle de tou- 
tes les réserves. Il s’ensuit qu'il y a des prix fictifs optimaux qui 
correspondent au profit maximal de l’entreprise, c.-à-d. à la distri- 
bution optimale des ressources. On voit donc que la détermination 
des prix fictifs optimaux est étroitement liée au problème de distri- 
bution optimale des ressources, c.-à-d. au problème de programmation 
linéaire décrit par le système d'équations (7-8) et par la fonction 
objectif (7-9). Toutefois, pour déterminer les prix fictifs optimaux, 
on peut élaborer un problème de programmation linéaire à part. 
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Désignons par uv; le prix fictif de l’unité de ressources S;. Les 
valeurs de u, doivent être telles que le prix fictif des ressources uti- 
lisées dans n'importe quel processus technologique ne soit pas infé- 
rieur au profit réalisé. En faisant appel aux désignations de l’exem- 
ple 7-1 et aux données du tableau 7-1, écrivons cette condition com- 
me suit 

m 
> dijli 2 C;j, j= 4, .., L. (7-33) 


i=1 


Si l’on introduit les variables u,:; > 0, qui représentent le 
dépassement qu'a le prix fictif de l'unité de production par rapport 
aux profits apportés par sa réalisation, le système d'’inégalités (7-33) 
se transforme en système d'équations suivant: 


m 


à Gijli —Umrj = Cjy J—=1,...,1. (1-34) 


Les prix fictifs optimaux seront ceux qui minimisent le prix 
total des ressources, c.-à-d. la grandeur 


m 
q* = 2 biu:. (7-35) 

Le système de contraintes (7-33) et la fonction objectif (7-35) 
représentent un nouveau problème de programmation linéaire appelé 
problème dual par rapport au problème donné à l'exemple 7-1 qui 
est dit problème primal (on dit encore problème initial ou fondamen- 
tal) de programmation linéaire. 

Il est aisé de remarquer que les problèmes primal et dual sont 
étroitement liés l’un à l’autre de la façon suivante: 

si le problème primal est un problème de maximisation de la 
fonction objectif, le problème dual sera un problème de minimisa- 
tion : 

les coefficients de la fonction objectif du problème primal appa- 
raissent comme les constantes des contraintes du problème dual; 

les constantes des contraintes du problème primal figurent au 
problème dual comme coefficients de la fonction objectif ; 

les coefficients des variables des contraintes du problème dual 
représentent les colonnes du tableau de coefficients du problème 
primal ; 

le sens des inégalités représentant les contraintes est inversé, 
sauf en ce qui concerne la contrainte de non-négativité des variables. 

La résolution du problème primal est étroitement liée à celle 
du problème dual de programmation linéaire. Pour établir cette 
liaison, écrivons les équations des problèmes primal et dual d’une 
façon différente. 


15—0732 
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Supposons libres les variables x,. ..., x, du problème primal 
et formulons ce dernier comme suit: 


maximiser 
L 
g —0— À (— ci) 2; (7-36) 
sous les contraintes 
zu =b— Ÿ dit, i=1,...,m. (7-37) 
j= 


A ce problème est associée une matrice de la forme 
4 — Li ee. “— T1} 
g'IO—c ...—c 


Lir1 || O4 @ys -.. Gus | (7-38) 


Liym || Om Œm1 - + Ami 


Prenons uw, ..., un en qualité de variables libres du problème 
dual et formulons-le de la façon suivante: 


minimiser 
m 
q° = O0 + D bu; (7-39) 
i=1 
sous les contraintes 
Um+j = —Cj + DETTE j=1, RES À (7-40) 
1—= 


A ce problème est associée une matrice de la forme 
4 Ui . Um 


q° 0 bi... Om 


Um+s || — Ci Gi - + Ami | (7-41) 


Umn+t || — Cr du - + Ami 


On voit que les colonnes de la matrice (7-41) correspondent aux 
lignes de la matrice (7-38). Il s’ensuit que les problèmes primal et 
dual peuvent être décrits par la même matrice (7-38) en lui associant 
la correspondance suivante entre les variables du primal et du dual: 


(7-42) 


LT; > — Ut j: j=1,...,l; | 


Tir > U;, 1—1,..., m.. 
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I1 est à remarquer que toute transformation de la matrice (7-38) 
réalisée d’après les règles données au paragraphe précédent aboutit 
à une nouvelle matrice qui va décrire aussi bien le problème primal 
que celui dual. Il en découle que la matrice de la forme la plus géné- 
rale (7-31) peut servir à la description des problèmes primal et dual 
de programmation linéaire. Si, dans ce cas, les éléments de la pre- 
mière colonne (sauf, peut-être, &%) sont positifs, la matrice corres- 
pond à une solution de base admissible du problème primal. Si ce 
sont les éléments de la première ligne (sauf, peut-être, &%) qui sont 
positifs, la matrice correspond à une solution admissible du problème 
dual. Mais si les éléments aussi bien de la première colonne que de 
la ligne supérieure de la matrice (7-31) sont positifs (à l'exception, 
peut-être, de &s), alors la matrice correspond à la solution optimale 
de tous les deux problèmes primal et dual. Dans ce cas, le coefficient 
%o donne la valeur de la fonction objectif qui, pour la solution 
optimale, est la même pour le problème primal et pour celui dual: 


max — Jnin- (7-43) 

Exemple 7-5. Le problème de distribution des ressources est donné par le 

tableau 7-3. Les lignes et les colonnes supplémentaires de ce tableau contiennent 

la solution du problème primal et du problème dual de programmation linéaire, 

c.-à-d. on y trouve le plan optimal de distribution des ressources, les ressources 

restantes correspondant au plan optimal ct les prix fictifs. Le tableau montre 

que le prix des ressources S,, qui abondent. est nul. Le prix maximal caractérise 

les ressources S, qui sont utilisées dans tous les processus technologiques ct 
dont les réserves sont limitées. 

Tableau 7-3 
Données initiales du problème d'utilisation des ressources 


Consommation de ressources Ressour- 
par unité de production ces restan- 
Te see li | pus 
ns sources | dant au fictifs 
plan 
optimal 
S1 25 5,5 | 0 
ÿe 14 0 3,0 
S3 19 0 0,5 
ss 24 0 1,0 
RS SP PP PS RS EE 
Profits apportés 6 5 5 


par la réalisation 
d'une unité de 
production 


Plan optimal | 5,5 


es A PS PS 


Remarquons pour finir que les prix fictifs peuvent, dans certains cas, jouer 
un rôle important en qualité d’instrument de gestion. Ainsi, lorsqu'il s’agit d’une 
grosse entreprise ou d'une branche industrielle, où beaucoup de décisions sont 


15% 
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prises d’une façon indépendante par les sections et les groupements de produc- 
tion, il est parlois difficile d'informer chaque section sur les décisions prises par 
les autres sections. Dans ce cas, les prix fictifs constituent pour chaque section 
un bon repère qui leur permet de prendre des décisions proches de l’optimum au 
point de vue des intérêts de toute l’entreprise. 


d) Notion de programmation en nombres entiers 


Dans beaucoup de problèmes de programmation linéaire, les 
variables représentent des unités indivisibles. Ainsi, une entreprise 
ne peut pas fabriquer 7,5 avions, 4,8 turbines, etc. En présence 
d'un tel problème, on ajoute aux contraintes (7-1) et (7-2) une nou- 
velle exigeant que les variables zx; soient exprimées par des nombres 
entiers ou qu’elles soient des éléments d’un 
ensemble fini (voir l’exemple 7-4). Si l’on 
se réfère à l'interprétation géométrique, 
cela signifie que les solutions admissibles 
ne pourront pas être cherchées dans tout le 
domaine défini par les contraintes (7-1), 
© mais seulement en des points discrets isolés 

de ce domaine, comme on le voit sur la 
b figure 7-3. 
On peut, bien sür, essayer de résoudre 
! 2 3 # % le problème de ce type, sans tenir compte 
Fig. 7-3 E de la condition imposant une solution 
ig. 1-3. Ensemble des 7 . 

solutions admissibles €XPrimée par un nombre entier, et trouver 
dans un problème de pro- la solution définie par le point 1 sur la 
grammation en nombres figure 7-3, pour l’arrondir ensuite à l’entier 
entiers le plus proche, ce qui donnera le point 2 en 
tant que solution entière. Mais, en procé- 
dant de cette façon, on peut arriver à une solution qui est loin d’être 
optimale. Par exemple, la solution optimale en nombres entiers 

sur la figure 7-3 est donnée par le point 3. 

Il y a plusieurs méthodes de résolution du problème de program- 
mation en nombres entiers parmi lesquelles la plus répandue est la 
méthode de Gomory. Sans nous attarder sur les calculs liés à cette 
méthode [45 et 46], nous n'’indiquerons ci-dessous que son idée 
générale. 

La méthode de Gomory est basée sur la méthode du simplexe à 
l’aide de laquelle on recherche la solution optimale sans égard pour 
la condition imposant que les variables soient entières ou discrètes. 
Si cette solution n’est pas en nombres entiers, on introduit une con- 
trainte supplémentaire représentée sur la figure 7-3 par la ligne ab 
qui sépare une partie du domaine des solutions admissibles conte- 
nant la solution optimale trouvée et ne comportant aucun point 
admissible entier. Compte tenu de cette contrainte supplémentaire, 
la solution optimale trouvée ne sera pas comprise dans le nouveau 


v] 
4 
J 
2 O 


Jo 0 0 
0 
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domaine des solutions admissibles, c.-à-d. elle sera inadmissible. 
C'est pourquoi le problème est à nouveau résolu par la méthode du 
simplexe pour trouver la solution optimale correspondant au nou- 
veau domaine des solutions admissibles. Si cette dernière solution 
n'est pas entière non plus, la procédure est réitérée. 

Ces derniers temps, pour la résolution du problème de program- 
mation en nombres entiers, on applique avec succès des méthodes 
combinatoires dont la plus importante est celle des branches et des 
frontières [46]. 


PROBLÈMES AU CHAPITRE 7 


7-1. Transformer les inégalités (7-10) en équations. Quel est le sens physique 
des variables qu’il faut ajouter dans ce cas? 

7-2. Trouver par la méthode du simplexe le plan optimal de distribution 
des ressources suivant les données de l'exemple 7-5, en posant, à l'étape initia- 
le, x;, r. et r; comme variables libres. 

7-3. Résoudre par la méthode du simplexe le problème dual correspondant 
aux données de l'exemple 7-5 en posant, à l’étape initiale, u,, u,, u et u- com- 
me variables libres. Comparer la matrice associée à la solution optimale avec 
la matrice correspondante du problème 7-2. 


CHAPITRE 8 


THÉORIE DES JEUX 


8-1. OBJET DE LA THÉORIE DES JEUX 


a) Le jeu en tant que modèle d’une situation de conflit 


La théorie des jeux est une discipline mathématique à développe- 
ment impétueux qui étudie les méthodes concernant la prise de déci- 
sions dans les situations dites de conflit (54, 55]. La situation est 
dite de conflit lorsque les intérêts opposés de plusieurs (d'habitude 
de deux) personnes s’y heurtent. Chacun des participants peut 
réaliser toute une série de mesures pour atteindre son but, le succès 
de l’un d'eux signifiant l’insuccès de l’autre. 

J. von Neumann et ©. Morgenstern [56], auteurs du premier traité 
fondamental sur la théorie des jeux, ont entrepris l'analyse des 
situations de conflit dans le domaine économique où, en présence 
d’un régime de libre concurrence, on a en tant que participants à 
intérêts opposés des maisons de commerce, des entreprises industriel- 
les, etc. Pourtant, les situations de conflit se rencontrent dans beau- 
coup d’autres domaines. Aux situations de conflit se rapportent 
presque toutes les situations qui prennent naissance lors de la pla- 
nification des opérations militaires, du choix d’un système d’arme- 
ment, de la défense des objectifs contre les attaques, de la poursuite 
et de l’interception du but, et ainsi de suite. Comme exemples inté- 
ressants de situations de conflit on peut citer les compétitions spor- 
tives, les litiges réglés par arbitrage. les ventes aux enchères et les 
élections parlementaires où plusieurs personnes posent leurs candida- 
tures pour un seul siège. 

On voit donc que dans la pratique on a affaire à une grande varié- 
té de situations de conflit. D’habitude, il est difficile d'entreprendre 
une analyse directe de ces situations à cause d’un grand nombre de 
facteurs secondaires accessoires. Pour rendre accessible l'analyse 
mathématique d'une situation de conflit, cette dernière doit être 
simplifiée et l’on ne doit prendre en considération que les facteurs 
essentiels. Le modèle formalisé simplifié d’une situation de conflit 
est appelé jeu, les participants au jeu étant nommés joueurs. Dans 
ce qui suit, nous nous bornerons à l’examen des jeux à deux partici- 
pants à intérêts opposés. Avant de donner une définition formelle 
du jeu, il est nécessaire de fournir quelques explications sur la ter- 
minologie utilisée qui pour la plupart est la même que celle utilisée 
dans les jeux de société (échecs, jeu de dames, jeux de cartes, etc.). 


8-1. OBJET DE LA THÉORIE DES JEUX 231 


Il faut distinguer la notion de jeu de la notion de partie indivi- 
duelle de ce jeu. Le jeu représente une collection de règles qui défi- 
nissent le comportement des joueurs. Chaque fois où l’on fait le 
jeu d’une façon concrète dès son commencement jusqu'à sa fin, on 
dit que l’on a fait une partie. Les coups sont les éléments constitu- 
tifs du jeu. Les règles du jeu définissent la succession des coups et 
indiquent le caractère de chaque coup. 

Il y a des coups personnels et des coups aléatoires. Le coup per- 
sonnel représente le choix fait par le joueur d’une variante dans 
l’ensemble des variantes donné. Par exemple, chaque coup aux échecs 
est un coup personnel, le premier coup pouvant être choisi parmi 
20 variantes possibles. La décision prise par le joueur qui dispose 
d’un coup personnel est appelée choix. 

Le coup aléatoire représente également un choix d’une variante 
parmi un ensemble des variantes, mais, cette fois-ci, la variante 
n’est pas choisie par le joueur mais par un mécanisme aléatoire. 
Comme exemples de coups aléatoires on peut citer la donne des car- 
tes ou le jet d’une pièce de monnaie (au jeu de pile ou face). Le choix 
effectué lors d’un coup aléatoire est appelé issue de ce coup. 

Par rapport aux coups, la structure des règles est la suivante. 

Les règles indiquent si le premier coup doit être un coup per- 
sonnel ou un coup aléatoire. S'il s’agit d'un coup personnel, les 
règles énumèrent les variantes possibles et indiquent le joueur qui 
doit faire le choix. Si le coup est aléatoire, les règles énumèrent les 
variantes possibles et stipulent les probabilités de leur choix. 

Pour chaque coup suivant, en fonction des choix et des issues 
des coups précédents, les règles déterminent : 

si ce coup doit être un coup personnel ou un coup aléatoire; 

les variantes possibles et les probabilités de leur choix si le coup 
est un coup aléatoire; 

le joueur qui fait le choix, les variantes possibles parmi lesquel- 
les on fait le choix et l’information concernant les choix et les issues 
des coups précédents si le coup est un coup personnel. 

Et enfin, en fonction des choix et des issues des coups qui se 
suivent (c.-à-d. en fonction de la marche du jeu), les règles indi- 


quent quand le jeu doit prendre fin, de même que le gain ou la perte 
de chacun des joueurs. 


b) Notion de stratégie 


Supposons que nous voulons faire une partie d'échecs avec les 
Blancs, mais que nous ne pouvons pas prendre personnellement 
part au jeu. Nous avons un suppléant qui doit faire la partie en 
exécutant toutes nos indications, mais qui ne sait pas jouer aux 
échecs et ne peut prendre indépendamment aucune décision. Pour 
que ce suppléant puisse faire toute la partie jusqu’à la fin, il doit 
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recevoir des instructions prévoyant toutes les positions possibles 
sur l’échiquier et déterminant le coup qui doit être joué pour chacune 
de ces positions. Le système complet d'instructions pareilles repré- 
sente la stratégie. 

Ainsi, la stratégie des Blancs doit indiquer le premier coup, ensui- 
te, pour chaque réponse possible des Noirs, le coup suivant des Blancs, 
etc. Evidemment, la composition d’une stratégie complète au jeu 
d'échecs est une tâche immense pratiquement irréalisable. Par 
exemple, si le’ joueur qui joue avec les Blancs participe personnelle- 
ment au jeu, il doit prendre deux décisions pour jouer les premiers 
deux coups, tandis que s’il fait appel à un suppléant, il doit pré- 
parer 21 décisions pour les mêmes deux coups (une décision pour le 
premier coup et 20 décisions pour les 20 premiers coups possibles 
des Noirs). Toutefois, la notion de stratégie est très utile dans beau- 
coup de problèmes plus simples. 

De cette façon, la stratégie du joueur représente une description 
univoque de son choix dans chaque situation possible où il doit 
jouer un coup personnel. 

Si le jeu ne comporte que des coups personnels, l'issue du jeu 
est définie si chacun des joueurs a choisi sa stratégie. Mais si le jeu 
comporte des coups aléatoires, il aura un caractère probabiliste et 
le choix des stratégies des joueurs ne pourra pas déterminer défini- 
tivement l'issue du jeu. 


c) Description formelle d’un jeu à deux personnes 


Désignons par X et Ÿ les ensembles ou les espaces contenant tou- 
tes les stratégies possibles mises à la disposition des participants 
au jeu qui, dans ce qui suit, seront appelés respectivement premier 
et deuxième joueurs. Les grandeurs x € À et y € Ÿ  représenteront 
les stratégies concrètes du premier et du deuxième joueur. 

Pour examiner les coups aléatoires, il est commode de considérer 
qu'un troisième joueur participe au jeu et qu'il utilise un mécanis- 
me aléatoire pour jouer ses coups aléatoires. Désignons par À l’espace 
des stratégies de ce joueur. Toute stratégie k € H du troisième joueur 
constituée par la suite concrète de tous les coups aléatoires de la 
partie se rencontrera avec une certaine probabilité p (h) facile à cal- 
culer lorsqu'on connaît la probabilité de chaque coup aléatoire 
dans cette suite. On voit facilement que p (h) représente la distri- 
bution de probabilités sur l'espace A, c.-à-d. qu'elle satisfait aux 
conditions suivantes: 


p(h)>0, > p(h)=1. (8-1) 
hCH 


Désignons par g une certaine variante du jeu, c.-à-d. une des 
parties possibles. Cette variante sera définie si les stratégies x et y 
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des joueurs de même que la stratégie k des coups aléatoires sont choi- 
sies. Il s'ensuit que la partie concrète g représente un triplet des 
grandeurs x, y et À: 


£ = (x, y,{h). (8-2) 


Le résultat de la partie sera exprimé par le gain ou la perte de 
chacun des joueurs. Pour plus de commodité, les gains et les pertes 
seront exprimés par un certain nombre, par exemple, par une somme 
d'argent en roubles. 

Examinons une des parties concrètes g (x, y, h) et notons respec- 
tivement par L. (x, y, h) et L, (x, y, h) les pertes du premier et du 
deuxième joueur, les gains étant considérés comme des pertes néga- 
tives. La somme totale des pertes des deux joueurs sera: 


L, (x, y, h) + L, (z, y, h). (8-3) 


Dans ce qui suit, nous ne considérerons que les jeux à somme nulle, 
c.-à-d. les jeux dont la somme totale des pertes (8-3) est nulle. Dans 
ce cas, la perte de l’un des joueurs est égale au gain de l’autre. 

En étudiant les jeux à somme nulle, il est superflu de compta- 
biliser séparément les pertes ou les gains des deux joueurs, car on 
peut se limiter seulement à l’examen de la perte du deuxième joueur 
(du gain du premier joueur): 


L,(z, y, h) = —L, (zx, y, h) = L (zx, y, h). (8-4) 


Etant donné que la stratégie h est aléatoire, on voit que lorsqu'on 
choisit les stratégies z et y, la perte L (x, y, h) sera une variable 
aléatoire avec la distribution de probabilités p (h) sur l’espace H. 
C'est pourquoi on ne peut estimer les stratégies z et y choisies qu'en 
prenant la moyenne des pertes L (x, y, h) sur tout l’espace }, 
c.-à-d. en introduisant la notion de pertes moyennes L (x, y) déter- 
minées conformément à (5-64) à partir de la relation 


L(x, y)=— a (x, y, k) p(h). (S-5) 


Le jeu sera défini si toutes les stratégies possibles des joueurs sont 
énumérées, c.-à-d. si les espaces X et Ÿ sont donnes, et si pour tous 
zEX et yEY les pertes L (x, y) sont déterminées. De cette façon, 
nous arrivons à la définition formelle suivante du jeu. 

Le jeu G est défini par le triplet 


G= (X, Y, L), (8-6) 


où X°et Ÿ représentent certains espaces et L est une fonction numé- 
rique bornée définie sur le produit direct X X Ÿ. Les points x € X 
et y E Ÿ sont appelés stratégies du premier et du deuxième joueur, 
tandis que la fonction L est nommée fonction de pertes (ou fonction 
de paiement). 
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Il est commode de représenter les jeux où chaque joueur dispose 
d’un nombre fini de stratégies (jeux finis) sousla forme d’une matrice 
dite de paiement. Soit G = (X, Ÿ, L) un jeu fini, où X — 


= {2,, ..., Im} et Ÿ —= {yy, - . ., Yn}. Alors, la matrice d'ordre 
mx<n 


Q=—| Gill = ee. (8-7) 
mi - -- Imn 


dans laquelle g;; = L (x;, y;) est appelée matrice du jeu G. 

Pour achever la description du jeu, il faut indiquer les buts qui 
conduisent les joueurs à choisir leurs stratégies. Ces buts sont assez 
simples. Le premier joueur tâche d'obtenir le gain maximal, c.-à-d. 
de maximiser la fonction L (x, y), tandis que le deuxième joueur 
s'efforce de rendre sa perte minimale, c.-à-d. de minimiser la fonc- 
tion L (x, y). On voit donc que les buts des joueurs sont diamétra- 
lement opposés. Dans ce cas, la difficulté spécifique consiste dans le 
fait qu’aucun des joueurs n’a le contrôle absolu de la valeur de L (x, y), 
car le premier ne dispose que des valeurs de x, tandis que le deuxième 
ne contrôle que les valeurs de y. L’élimination de cette difficulté, 
c.-à-d. la définition de la méthode la plus rationnelle de conduite 
du jeu par chacun des joueurs, constitue l'essentiel de la théorie des 
jeux. 

11 faut souligner que les raisonnements ci-dessus ne sont valables 
que pour un jeu à deux personnes à somme nulle. Si au jeu participent 
plus de deux personnes, on est en présence d’une situation tout à 
fait nouvelle caractérisée par le fait que certains joueurs peuvent 
conjuguer leurs efforts dans le cadre d’une coalition qui prévoit la 
distribution contractuelle du gain réalisé. Les membres de la coali- 
tion peuvent estimer leurs possibilités d’une façon plus complète 
et entreprendre des actions concertées pour s'assurer des gains plus 
importants. 

Une autre variante du jeu est le jeu à somme non nulle. Lorsqu'il 
s'agit d'un jeu pareil, les gains de certains joueurs peuvent être 
obtenus non seulement pour le compte des pertes des autres joueurs, 
mais aussi grâce à certains paiements versés de l'extérieur. Ces 
paiements peuvent être considérés comme la perte d’un joueur 
fictif supplémentaire, ce qui permet de ramener un jeu à z personnes 
à somme non nulle à un jeu à #7 + Î personnes à somme nulle. 

Vu que la théorie des jeux à rx personnes, où n2>2, est assez 
compliquée et que son élaboration est loin d’être achevée, nous al- 
lons nous limiter à l’étude du jeu à deux personnes à somme nulle. 


Exemple 8-1. Pour ‘expliquer les notions introduites, examinons un jeu 
comportant quatre coups. 


Premier coup (personnel). Le premier joueur choisit un des deux nombres 
entiers 1, 2 
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Deuxième coup (aléatoire). On jette une pièce de monnaie et si, et seule- 
ment si, ce jet amène pile, on communique au deuxième joueur le choix fait par 
le premier. 

Troisième coup (personnel). Le deuxième joueur choisit un des deux nombres 
entiers 3, 4. 

Quatrième coup (aléatoire). On choisit au hasard avec les probabilités 
0,4; 0,2; 0,4 un des trois nombres entiers 1, 2, 3. 

Résultat du jeu: les nombres choisis aux premier, troisième et quatrième 
coups sont additionnés et la somme ainsi obtenue est payée par le deuxième 
joueur au premier si elle,est paire, ou bien par le premier joueur au deuxième 
si elle est impaire. 


Pour entreprendre l’analyse préliminaire du jeu, il est commode 
de le représenter sous la forme d’un arbre descendant dont les som- 
mets représentent les situations qui surgissent pendant le déroulement 
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Fig. 8-1. Arbre du jeu 


du jeu, tandis que les branches réunissant ces sommets correspondent 
aux coups joués. L'arbre du jeu qui nous intéresse est donné sur la 
figure 8-1. Les sommets correspondant aux coups personnels du 
premier et du deuxième joueur sont respectivement désignés par 7 
et ZI. Les sommets correspondant aux coups aléatoires sont notés 
par O. Les sommets terminaux qui définissent les différentes varian- 
tes du jeu sont marqués de chiffres indiquant les pertes du deuxième 
joueur. 

Dans différents sommets correspondant aux coups personnels le 
joueur possède une certaine information sur les coups précédents. 
Si dans certains sommets le joueur est en possession de la même infor- 
mation, il est commode de réunir ces sommets en obtenant ainsi 
des groupes de sommets S; dits classes d’information. L'exemple 
examiné présente quatre classes d’information dont le contenu est 
le suivant: 
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S,: il n’y a pas eu de coups; le premier joueur doit jouer le pre- 
mier Coup; 

S.: le premier joueur a choisi 1; 

Ss: le premier joueur a choisi 2; 

S,: on ne sait pas le choix fait par le premier joueur. 

Si le deuxième joueur tombe sur un sommet de la classe S,, il 
est privé d’information sur le choix fait par le premier joueur. Un 
tel jeu est appelé jeu avec information incomplète. Si la classe d'infor- 
mation ne comporte qu'un seul sommet, le joueur qui y tombe est 
parfaitement informé sur tous les coups précédents (il peut obtenir 
cette information en suivant, par exemple, sur l’arbre du jeu le che- 
minement qui mène au sommet donné), c.-à-d. il est en possession 
de toute l'information concernant le jeu. Les jeux dont chaque classe 
d’information ne comporte qu’un seul sommet sont appelés jeux 
avec information complète (échecs, dames, dominos, etc.). 

Examinons les espaces des stratégies des joueurs. L'espace des 
stratégies du premier joueur, qui ne comprend que deux éléments 
auxquels correspond le choix 1 ou 2, est décrit par le tableau 8-1. a. 
La stratégie du deuxième joueur doit indiquer son coup pour n'’im- 
porte quelle variante de jeu, tandis que cette variante est définie 
par la classe d’information du joueur. Pour le deuxième joueur, on 
a trois classes d’information: S,, $S, et S,. Ainsi donc. la stratégie 
du deuxième joueur est d’indiquer lequel des deux nombres 3 ou 4 


Tableau S-1 
Espaces des stratégies pour le jeu de l’exemple 8-1 


x! 


(1) 


(333) | (334) | (333) | (344) (433) | (434) | (443) (444) 
b) 
k | (P, 1) | (P, 2) | (P, 3) | (F, 1) | (F, 2) | (F. 3) 


p(k) | 0,2 | 0,1 | 0,2 | 0,2 | 0,1 | 0,2 


c) 
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il va choisir dans chaque classe d’information. La stratégie (4, 3, 3) 
signifie que le deuxième joueur choisit 4 dans la classe d’informa- 
tion S. et 3 dans les classes d’information S., et S,. L'espace des 
stratégies du deuxième joueur est donné au tableau 8-1,b. 

Les stratégies aléatoires À comportent deux coups: le deuxième 
coup (le choix de P ou de F avec les probabilités 0,5; 0,5) et le 
quatrième coup (le choix du nombre 1, 2 ou 3 avec les probabilités 
0,4 ; 0,2; 0,4). La probabilité de chaque stratégie est égale au pro- 
duit des probabilités des issues de ces deux coups. L'espace des 
stratégies aléatoires H et la distribution de probabilités p (k) sont 
donnés au tableau 8-1,c. 

Pour composer la matrice de paiement, il faut déterminer les 
pertes g;; = L (x;, y;) conformément à (8-5): 


Qiy= > Lx yy, h)p(h). 
KEH 


où les grandeurs ZL (x;, y;, h) représentent les chiffres dont sont 
marqués les sommets terminaux de l'arbre du jeu. Les grandeurs 
qi sont commodes à calculer à l’aide des tableaux analogues au 
tableau 8-2 compilé pour la détermination de qu. 


Tableau 8-2 
Calcul des pertes 41, pour le jeu de l'exemple 8-1 


h p (h) L(x1, y1, À) L (xs, ys, À) p (h) 
P,1 0,2 +5 1,0 
P,2 0,1 —6 —0, 

P,3 0,2 +7 1,4 

F,1 0,2 5 41,0 

F,2 0,1 —6 —0, 

F,3 0,2 7 1,4 
qu = + 3,0 


d) Valeurs supérieure et inférieure du jeu 


Pour comprendre les principes qui sont à la base du choix que 
fait chaque joueur pour adopter sa stratégie, examinons le jeu dont 
la matrice est donnée par le tableau 8-3. 

Supposons que le premier joueur ait choisi la stratégie z,. Si 
le gain ZL (x,, y) dépend de la stratégie qui sera choisie par le deu- 
xième joueur (par exemple, pour la stratégie x,, les gains du premier 
joueur peuvent être 7, 2, 5, 1), le premier joueur pourra-t-il comp- 
ter sur le gain maximal 7? Oui, s’il suppose que le deuxième joueur 
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Tableau 8-3 
Matrice d’un jeu avec point-selle 


A (x) 
T{ 7 2 5 1 | 
Zo 2 2 3 4 2 
z3 5 3 4 4 3° 
z, 3 2 1 6 1 
B (y) | ni 3° 5 6 | 


choisira la stratégie y,. Mais le deuxième joueur peut choisir n'im- 
porte quelle autre stratégie y compris y, pour laquelle le gain du 
premier joueur sera 1. Mais quelle que soit la stratégie du deuxième 
joueur, le gain du premier joueur ne sera jamais inférieur à 1. C’est 
pourquoi 4, qui est l'élément minimal de l'ensemble L (x;,, y) = 
— {7, 2, 5, 1}, représente le gain garanti du premier joueur pour 
la stratégie z.. 

En généralisant les raisonnements ci-dessus, on voit que si le 
premier joueur adopte la stratégie x,, il s'assurera un gain garanti 
A (x:) égal à l’élément minimal de l’ensemble L (xr,, y): 


A(zr) = minL (xx, y). (8-8) 
[y 


La théorie des jeux suppose que les joueurs sont assez prudents et 
n’encourent pas de risques injustifiés. Dans ce cas, le premier joueur 
doit choisir la stratégie x € X qui correspond au nombre A (x) maxi- 
mal. En désignant le gain garanti du premier joueur par æ et en 
l'appelant valeur nette inférieure du jeu, on a 


a = max À (x) — max min L(x, y). (8-9) 
x x ru 


Les valeurs de À (x) correspondant à un jeu dont la matrice est 
de la forme donnée au tableau 8-3 sont portées dans la dernière 
colonne, dans laquelle la valeur de & est marquée d'un astérisque. 

Des raisonnements analogues sont valables pour le deuxième 
joueur, à la différence que dans la matrice du jeu on indique ses 
pertes qu’il tend à rendre minimales. Examinons la stratégie y}. 
Cette stratégie peut lui apporter une perte non supérieure à 


B (y:) = max L (x, y). (8-10) 
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Pour s’assurer la perte minimale, le deuxième joueur doit adopter 
la stratégie y € Ÿ qui correspond au nombre B (y) minimal. En 
désignant par f la perte à laquelle peut se limiter le deuxième joueur 
et en l'appelant valeur nette supérieure du jeu, on a 

B= min B(y)=minmaxL (x, y). (5-11) 
V /] x 


Les valeurs de B (y) pour un jeu dont la matrice est de la forme 
donnée au tableau 8-3 sont portées dans la ligne inférieure du tableau, 
dans laquelle la valeur de f est marquée d'un astérisque. 

Théorème 8-1. Si G — (X, Y, L) est un certain jeu, pour tous 
zEX et yEY,ona 


AG)<L(z y<B(yeta< $. 


Démonstration. Par définition 


A(z)=min£Lt(x, y) <L(zx, y); (8-12) 

y 
B(y)=maxL (x, y)>L(x, y). (S-13). 

Donc, " 
A (x) < L (x, y) < B (y). (8-14) 


Etant donné que cette relation est vérifiée pour n'importe quels 
zEXetyE Ÿ, en choisissant pour z la valeur pour laquelle A (x) — 
= & et pour y la valeur pour laquelle B (y) = B, on obtient: 


a < B. (8-15) 


On voit donc que la valeur inférieure du jeu, c.-à-d. le gain 
que peut s'assurer le premier joueur, ne dépasse pas la valeur supé- 
rieure du jeu, c.-à-d. la perte à laquelle peut se borner le deuxième 
joueur. 
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a) Jeu avec point-selle 


Le cas particulier le plus simple de jeu se présente lorsque « = $. 
Désignons cette grandeur parc. C’est justement à ce cas que se rap- 
porte le jeu dont la matrice est donnée au tableau 8-3, où x = B = 3. 

Ici, aucune stratégie ne peut garantir au premier joueur un gain 
supérieur à B, car c’est justement à cette grandeur f que le deuxième 
joueur peut limiter sa perte. D'autre part, aucune stratégie ne peut 
garantir au deuxième joueur une perte inférieure à &, étant donné 
que le premier joueur peut s'assurer un gain égal à &. Il s'ensuit 
donc que si & = ff = c, aucune stratégie des deux joueurs ne peut 
leur garantir un résultat meilleur que c. En même temps, chacun 
des joueurs peut s'assurer le résultat c. Autrement dit, ni le premier, 
ni le deuxième joueur ne dispose d’une stratégie meilleure que celle 
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qui leur assure le résultat c. Dans ce cas, c est appelé valeur nette du 
jeu, tandis que les stratégies des joueurs qui leur assurent le résultat 
c sont dites stratégies optimales. 

La case de la matrice qui définit la grandeur c est appelée point- 
selle, car la valeur de c est le maximum de la colonne et le minimum 
de la ligne à l'intersection desquelles se trouve cette grandeur. Pour 
cette raison, un jeu dont la valeur est nette est appelé jeu avec point- 
selle. 

Un jeu avec point-selle est dit équitable si c = 0. Sic O0, le 
jeu est non équitable et pour le rendre équitable, en début de chaque 
nouvelle partie le premier joueur doit payer la quantité c au 
deuxième joueur. 


b) Stratégies pures et mixtes 


Si le jeu n’a pas de point-selle, la détermination de la valeur du 
jeu et des stratégies optimales des joueurs devient plus difficile. 
Examinons, par exemple, le jeu dont la matrice est donnée au ta- 
bleau 8-4. Dans ce jeu, « — 4 et B —5. On voit donc que le premier 
joueur peut s’assurer un gain égal à 4 tandis que le deuxième joueur 
peut limiter sa perte à 5. Le domaine situé entre B et & n’appartient 
à personne et chacun des joueurs peut tâcher d'améliorer son résul- 
tat pour le compte de ce domaine. Quelles doivent être, dans ce cas, 

Tableau 8-4 les stratégies optimales des 


. | j joueurs ? 

Matrice d’un jeu sans point-selle Si chacun des joueurs adop- 
TJ te la stratégie marquée d’un 
| vi v2 A (x) astérisque (zx. et y), le gain 
du premier joueur et la perte 
du deuxième seront égaux à 5. 
‘1 3 6 3 Cela ne convient pas au 

To 5 4 4% 


T2 deuxième joueur, car le premier 
gagne plus qu'il ne peut s’assu- 

B (1) | 5+ 6 | rer. Mais si le deuxième 
joueur arrive d’une façon ou 

d'une autre à deviner les 

intentions du premier joueur relatives à l'adoption de la stra- 
tégie Ze, il pourra alors adopter la stratégie Ye en réduisant ainsi 
à 4 le gain du premier joueur. Il est vrai que si le premier 
joueur apprend les dessins du deuxième quant à l'adoption de la 
stratégie y., il pourra mettre en œuvre la stratégie x, en portant 
ainsi son gain à 6. De cette façon, il se crée une situation où chaque 
joueur doit tenir en secret la stratégie qu'il a l’intention d'adopter. 
Mais comment y parvenir? Si la partie est réitérée plusieurs fois et 
si le deuxième joueur adopte toujours la stratégie y., le premier 
joueur arrivera bientôt à deviner ses intentions et, en adoptant la 
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stratégie z,, il obtiendra un gain supplémentaire. Il est évident que 
le deuxième joueur doit changer de stratégie dans chaque nouvelle 
partie, mais ses actions doivent être telles que le premier joueur ne 
devine pas la stratégie qu'il va adopter chaque fois. 

Le secret peut être gardé si chaque fois la stratégie est choisie 
au hasard en utilisant à cette fin un certain mécanisme aleatoire. 
Par exemple, le deuxième joueur peut jeter une pièce de monnaie et 
adopter la stratégie y, si le jet amène pile, ou la stratégie y, si c’est 
face. Cette façon d'agir prive l'adversaire de toute possibilité d’anti- 
ciper les actions de l’autre joueur. 

Lorsqu'on utilise un mécanisme aléatoire, les gains et les pertes 
des joueurs seront des variables aléatoires. Dans ce cas, le résultat 
du jeu peut être apprécié par la perte moyenne du deuxième joueur. 
Ainsi, lorsque dans un jeu dont la matrice est de la forme donnée 
par le tableau 8-4 le deuxième joueur adopte les stratégies y, et y, 
d'une façon aléatoire avec les probabilités 0,5 ; 0,5, sa perte moyenne, 
pour la stratégie x, du premier joueur, sera: 


Lan =— Qu °0,9 + Que 0,9 — 3-0,5 + 6-0,5 —= 4,5, 
et pour la stratégie x, du premier joueur 
Lm = Qo1° 0,5 + 922°0,5 = 5-0,5 + 4-0,5 = 4,5. 


Donc, le deuxième joueur peut limiter sa perte moyenne à 4,5 in- 
dépendamment de la stratégie adoptée par le premier joueur. 

On voit de cette façon que dans certains cas il n’est pas rationnel 
de désigner à l’avance la stratégie qui sera adoptée et qu’il est pré- 
férable de la choisir au hasard en utilisant à cette fin un mécanisme 
aléatoire. La stratégie basée sur un choix aléatoire sera appelée 
stratégie mixte contrairement aux stratégies désignées à l'avance et 
examinées précédemment qui seront maintenant appelées sératé- 
gies pures. 

Donnons maintenant une définition plus rigoureuse des straté- 
gies pures et mixtes. | 

Soit G — (X, Ÿ, L) un certain jeu. Les espaces X — {x,,..., rm} 
et Ÿ — {y,, . -., y}, qui comportent les énumérations de toutes 
les stratégies possibles des joueurs, sont appelés espaces des straté- 
gies pures, les éléments x € X et y € Ÿ de ces espaces étant les stra- 
tégies pures des joueurs. 

Pour obtenir une stratégie mixte, le joueur doit utiliser un 
certain mécanisme aléatoire (jet d'une pièce de monnaie, d'un dé, 
etc.) dont le nombre d'’issues est égal au nombre de stratégies pures 
se trouvant à sa disposition. 

Supposons que le mécanisme aléatoire du premier joueur est à 
m issues qui forment l’ensemble R = {r?, ..., r(®%}. Désignons 
par EP, ..., Et les probabilités avec lesquelles apparaissent les 
issues correspondantes du mécanisme aléatoire. 


16—0732 
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La stratégie mixte du premier joueur consiste dans le fait qu'à 
chaque issue r € À on associe une stratégie pure x € X. De cette 
façon les grandeurs E‘!, ..., Et” représenteront les probabilités 
avec lesquelles sont utilisées les stratégies pures x,, . .., x,. L’en- 
semble ordonné E — (Et, ..., EE‘) dont les éléments satisfont 
aux conditions 

020, NE =1 (8-16) 
peut maintenant être considéré en tant que distribution de probabili- 
tés & (x) sur l’espace X. Cette distribution de probabilités définit 
complètement le caractère du ieu du premier joueur et est appelée 
sa stratégie mixte correspondant au mécanisme aléatoire donné. 

Un autre mécanisme aléatoire amènera à une autre distribution 
de probabilités £” (x) et déterminera une autre stratégie mixte du 
premier joueur. 

Dans le cas général, le premier joueur peut disposer d'une infinité 
de mécanismes aléatoires déterminant toutes les distributions de 
probabilités possibles sur l’espace de ses stratégies pures: 


E (890, ...,800), He (E60, ..., 00) (8-17) 
Dans ce cas, l’ensemble 
E — {E19 Es, .. .} (8-18) 


représentera l'espace des stratégies mixtes du premier joueur. 

D'une façon analogue, le deuxième joueur peut utiliser son méca- 
nisme aléatoire qui définit les probabilités n‘?, . .., n‘” avec les- 
quelles seront utilisées les stratégies pures y,, . .., y,. Dans ce 
cas, l’ensemble ordonné n = (n‘”, ..., n‘”) dont les éléments 
vérifient les relations 


n>0, ni (8-19) 
R 


représente la distribution de probabilités n (y) sur l’espace Y et est 
appelé stratégie mixte du deuxième joueur. 

Le deuxième joueur, aussi bien que le premier, peut disposer 
d’une infinité de mécanismes aléatoires déterminant les différentes 
distributions de probabilités sur l’espace de ses stratégies pures: 


ur — (n*”, ..) n°”) ; Me —= (ne, ..) mn?) ...) (S-20) 


dont l’ensemble 
H = {nu Nos - - -} (8-21) 


forme l’espace des stratégies mixtes du deuxième joueur. 
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c) Fonction de pertes 
lors de l’utilisation des stratégies mixtes 


Examinons le jeu G = (X, }’, L) dans lequel X = {r,,....zx»} 
et Y — {y,, . . ., y, } sont les espaces des stratégies pures des joueurs. 
L (x, y) représentant les pertes du deuxième joueur déterminées 
pour les stratégies pures x € X et y € ŸY. Dans ce qui suit, la fonc- 
tion L (x, y) sera appelée fonction de pertes. 

Supposons maintenant que les joueurs adoptent des stratégies 
mixtes. Cela signifie que l’on donne les ensembles E == {E,, E., ...} 
et H — {n,, +, - .- .} dont les éléments représentent les stratégies 
mixtes des joueurs, c.-à-d. les différentes distributions de probabi- 
lités & (x) et n (y) sur les espaces X et Y. Le caractère du jeu sera 
défini lorsque chaque joueur choisira sa stratégie mixte EEE et 
n € H. I] s'ensuit que, lors de l’utilisation des stratégies mixtes, 
le jeu n’est plus défini par les ensembles X et Ÿ mais par les ensem- 
bles E et H. 

Lorsqu'on adopte des stratégies mixtes, la perte du deuxième 
joueur, donc la fonction de pertes, subira des changements. Etant 
donné que le caractère du jeu devient aléatoire, les gains et les pertes 
des joueurs revêtent aussi un caractère aléatoire. Pour cette raison, 
on ne peut parler maintenant que de la valeur moyenne du gain X 
ou de la perte Y, valeur déterminée aussi bien par la fonction de 
pertes L (x, y) que par les distributions de probabilités E (x) et 
n (y) et qui peut ètre trouvée d’après la formule de la valeur moyen- 
ne d'une fonction de deux variables: 


L (E, n)— DL (x, y) E (x) n (y). (8-22) 


La fonction de pertes L (£, n) doit ètre présente dans la défini- 
tion du jeu lors de l’utilisation des stratégies mixtes. 

De cette façon. lorsqu'on utilise des stratégies mixtes. à la place 
du jeu G = (X, }’, L) on obtient un nouveau jeu F — (E, H, L) 
qui est le centrage du jeu G. Dans ce nouveau jeu, la fonction de 
pertes L (£, n) est déterminée suivant la formule (8-22) en tant que 
moyenne de ZL(r, y) pour les distributions de probabilités E (x) 
et n (y) données. 

Tout ce qui vient d’être dit peut être résumé comme suit. 

Soit G — (X. Ÿ. L) un certain jeu et supposons que E et H 
définissent les différentes distributions de probabilités £ et n sur 
les espaces X et Ÿ, L(E, n) étant la valeur moyenne de la fonction de 
pertes. Alors le jeu 


T — (E, H, 1) (8-23) 


est le centrage du jeu G. 
y L'bg 
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Soit T = (E, H, L) le centrage du jeu G = (X, Y, L). Alors 
les points x € X et y € Y sont appelées stratégies pures dans le jeu G, 
les points EEE et n € H étant appelés stratégies mixtes dans le 
même jeu. 

Remarquons que les stratégies pures peuvent être considérées 
comme un cas particulier des stratégies mixtes. En effet, la stra- 
tégie mixte définie par la distribution de probabilités 


1 pour xz=— zx}; 


E(r)= (8-24) 


0 pour rx 78 


coïncide avec la stratégie pure x,, tandis que la stratégie mixte 
définie par la distribution de probabilités . 


1 pour y=y;; 
AW = 0 pour y# y: 


coïncide avec la stratégie pure y;. 


(8-25) 


d) Valeurs supérieure et inférieure du jeu 
lors de l’utilisation des stratégies mixtes 


Soient G — (X, Ÿ, L) un certain jeu et l = (E, H, L) son 
centrage. 

Supposons que le premier joueur adopte la stratégie mixte & € E. 
Ce joueur veut savoir quel sera son gain garanti, c.-à-d. le gain mini- 
mal qu'il puisse s'assurer à coup sûr même si le deuxième joueur 
adopte sa meilleure stratégie mixte n. Le cas où le deuxième joueur 
adopte une stratégie pure quelconque n’est pas exclu. 

Désignons par A (£) le gain garanti du premier joueur pour la 
stratégie &. Il est évident que, pour la stratégie ë donnée et pour diffé- 
rentes n € H, c’est la limite inférieure de la fonction de gain 
L (6, n), c.-à-d. 


Ar (£5)= minL (£, n). (8-26) 
n 


Ensuite, le premier joueur voudra savoir laquelle de toutes les 
stratégies possibles Ë € E lui rendra son gain garanti maximal, 
c.-à-d. la limite supérieure de la fonction Ar (E) désignée par ar et 
appelée valeur inférieure du jeu en présence de stratégies mixtes des 
joueurs : 


œr = max Âr (£) = max min L (E, n). (8-27) 
$ $ nn 
La stratégie pour laquelle la condition (8-27) est vérifiée est 


appelée stratégie mirimaxz (parfois on dit maximin) du premier 
joueur et est désignée par &o. 
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Supposons maintenant que le deuxième joueur ait choisi une 
certaine stratégie mixte n € H. Ce joueur veut savoir quelle sera sa 
perte maximale pour la meilleure stratégie ë € E du premier joueur, 
c.-à-d. la limite supérieure de la fonction Z (£, n), pour n donné 
et différents £ € E, limite désignée par Br (1): 


Br (n) — max L(E, 1). (8-28) 


Le deuxième joueur veut aussi savoir comment choisir une stra- 
tégie n € H pour laquelle sa perte soit minimale, c.-à-d. la limite 
inférieure de la fonction Br (n), désignée par Br et appelée valeur 
supérieure du jeu en présence de stratégies mixtes des joueurs: 


Br = min Br(n) = min max (E, n). (8-29) 
n n $ 


La stratégie pour laquelle la condition (8-29) est satisfaite est 
appelée stratégie minimax du deuxième joueur et se note ns. 

Pour faciliter les raisonnements ultérieurs, introduisons les 
désignations suivantes pour les valeurs inférieure et supérieure du 
jeu G — (X, Y, L) lors de l’utilisation des stratégies pures: 

AG (x) = min L (zx, y): gain garanti du premier joueur pour la 


y 
stratégie z € X ; 
&g — max AG (x): valeur inférieure du jeu G en présence de 
x 


strategies pures des joueurs; 
B, (y) = max L (x, y): perte maximale du deuxième joueur pour 
X 


la stratégie y € Y ; 
Bc = min B, (y): valeur supérieure du jeu G en présence de 


V 
stratégies pures des joueurs. 
Théorème 8-2. Si l’on a un jeu G—(X, Y, L) et si T — 
= (E, H, L) est le centrage du jeu G, alors 


a) Ar(Ë)= min L (E. y): à 
y 


b) ac <ar:; 
C) Br(n)=maxZ(x,n); ‘ (S-30) 


d) fc >Br; 
e) ar< Br. 
Le point a) nous dit que si le premier joueur choisit n'importe 
quelle stratégie mixte, son gain garanti sera égal au gain garanti 
lors de l'utilisation par le deuxième joueur seulement des stratégies 
pures. Conformément au point b), la valeur inférieure du jeu en 
présence de stratégies mixtes du premier joueur n’est pas inférieure à 
la valeur inférieure du jeu pour les stratégies pures, c.-à-d. il y a 
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une stratégie mixte qui, en tout cas, n'est pas pire que la stratégie 
pure optimale. Les points c) et d) contiennent des assertions analo- 
gues relatives au deuxième joueur. Le point e) signifie que la valeur 
inférieure du jeu &r, lors de l’utilisation des stratégies mixtes, ne 
dépasse pas la valeur supérieure du jeu, c.-à-d. qu’en adoptant les 
meilleures stratégies mixtes, le gain garanti du premier joueur 
ne sera pas supérieur à la perte assurée du deuxième joueur. 

Démonstration. a) Etant donné que les stratégies 
pures y € Ÿ” sont des cas particuliers des stratégies mixtes n € H, 
L (£, y) est un cas particulier de L (£, n), donc un sous-ensemble de 
L (£, n). En vertu du théorème de la borne inférieure d’un sous- 
ensemble (voir paragraphe 1-1), on a: 


min L(E, y) >min L(E, n) = Ar (à). (8-31) 
4 n 


Mais L (£, n) peut être considérée comme la moyenne de L (E, y) 
prise sur tous les y avec la distribution de probabilités n (y). En 
vertu du théorème de la moyenne (voir paragraphe5-5), on obtient : 


min L (E, y) LL (E, n). (8-32) 
Ù 


La relation (8-32) reste vraie pour toute n € H, y compris vb, 
pour laquelle L (E, n,) = min L (£, n). De cette façon, 
n 


min ZL(E.y)<minL(E, n)= Ar (E). (8-33) 
n 


v 

En comparant (8-51) à (8-33), on peut s'assurer que le point 
a) est vrai. 

b) En comparant AG(zxz) = min L(x, y) avec la grandeur 


V 
Ar (Ë), qui en vertu du point a) peut être définie de la même manière 
que AG (x) seulement pour les stratégies pures y du deuxième joueur, 
et tenant compte du fait que la stratégie pure x est un cas particu- 
lier de la stratégie mixte E (x), nous voyons que A; (x) est le sous- 
ensemble de Ar (£). En vertu du théorème de la borne supérieure d’un 
sous-ensemble, on a: 


max À (z) < max Ar (E), (8-34) 
x ë 
ce qui démontre le point b). 


Les points c) et d) sont démontrés d'une façon analogue. 
e) Par définition, on a: 


Ar (E)= minL(,n) <L(E, n). | 
n 


Br (n)= max L (&, n)>L(E, n). f (8-35) 


Donc 
Ar (8) < L (6, n) < Br ). (8-36) 
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Cela reste vrai pour toutes £ et n, c.-à-d. pour une Ë telle que 
Ar (£) = ar et pour une n telle que Br (n) = Br, ce qui démontre 
le paint e). 

Corollaire. En confrontant entre eux les points b), d) 
et e), on trouve: 


ac <ar Br < Bc- (8-37) 


De la relation (8-57) il découle que si le jeu G a une valeur nette, 
c.-à-d. si &c := Bo — c (nous avons vu que cela a lieu pour un jeu 
avec point-selle), alors &r := Br -- c, c.-à-d. le jeu F a lui aussi 
une valeur nette. C’est pourquoi la stratégie optimale dans le jeu G 
est aussi la stratégie optimale dans le jeu l. Dans ce cas, il est super- 
flu d'examiner le jeu l’, et les stratégies optimales des joueurs peuvent 
être trouvées par la méthode décrite pour le jeu avec point-selle. 

Mais le jeu [a été introduit dans le but d'analyser les jeux pour 
lesquels &; << B4, et on a le droit de poser la question suivante: 
n'est-il pas vrai que, dans ce cas, pour une grande classe de jeux, 
ar := Br = cr, et n'est-il pas permis de considérer cr en tant que 
valeur nette du jeu F? Dans ce qui suit nous allons montrer qu’ef- 
fectivement cela a lieu, de façon que l’adoption des stratégies mix- 
tes permet. dans ce cas aussi, de trouver la valeur du jeu et les stra- 
tégies optimales des joueurs. Donnons pour cela une autre défini- 
tion de la stratégie optimale. 

Soient un jeu G -= (X, Y, L) et son centrage l — (E, H, L). 
Si le jeu la une valeur nette cr == &r — Br, on dit que la valeur 
du jeu G est cr, et toute stratégie optimale dans le jeu F, c.-à-d. 
une stratégie qui assure un gain garanti du premier joueur et une 
perte garantie du deuxième joueur égaux à cr, est appelée stratégie 
optimale dans le jeu G. I] est aisé de voir que si &@r = Br = cr. les 
stratégies minimax &, (x) et n, (y) des joueurs seront leurs stratégies 
optimales. 

Le théorème qui affirme que chaque jeu fini a une valeur et que 
chaque joueur a à sa disposition des stratégies optimales est le théo- 
rème fondamental de la théorie des jeux. La démonstration de ce 
théorème fera l’objet du paragraphe suivant. 


8-3. THÉORÈME FONDAMENTAL DE LA THÉORIE DES JEUX 


a) S-jeu 


Une interprétation géométrique utile peut être donnée aux jeux 
dans lesquels le premier joueur dispose d'un nombre fini de straté- 
gies pures. Soit un jeu G = (X, Ÿ, L) dont la matrice Q = ||g;; || 
est définie par l’expression (8-7). Associons à chaque y € Y un point 
C dans un espace à m dimensions de façon que ses coordonnées repré- 
sentent les pertes du deuxième joueur pour toutes les stratégies 
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pures possibles du premier joueur : 
C — [L (z:, y), . L (Tr: y)]. (8-38) 


Tenant compte du fait que L (x;, y;) = q:; et en donnant à y 
toutes les valeurs possibles, nous obtiendrons nr points: 


Ci=: (Qits --.s Imt)s +. Cn = (dinr cs mn); (8-39) 


dont les coordonnées sont représentées par les pertes données par 
les colonnes correspondantes de la matrice du jeu. Le jeu donné 
par l’ensemble des points 


a {C. . Ch}; (8-40) 
V L2 


a été appelée S-jeu et se joue comme suit. 
Le deuxième joueur choisit un des points 
C; de l’ensemble (8-40), par exemple, le 
Ly=Ltæ,y) Point C3. Indépendamment du choix du 
deuxième joueur, le premier joueur choisit 
une coordonnée du point C;, par exemple, 
la deuxième. Dans ce cas, la perte du deu- 
| | | | xième joueur sera égale à la valeur de la 
Fig. se Représentation deuxième coordonnée du point C3, c.-à-d. gage 
Reometrique un S-jeu On voit donc qu'un S-jeu équivaut à un 
jeu ordinaire, tout au moins lorsqu'on adopte 
des stratégies pures, car le choix d’un point de l’ensemble (8.40) 
équivaut au choix de la stratégie y € Ÿ, tandis que le choix de la 
coordonnée de ce point équivaut au choix de la stratégie x € X. 
Si le premier joueur ne dispose que de deux stratégies, le S-jeu 
peut être représenté par une construction géométrique, car, dans 
ce cas, les points de l’ensemble (8-40) seront situés dans le plan. 


Exemple 8-2. Examinons le jeu dont la matrice est donnée par le tableau 8-5. 
Le S-jeu équivalent comporte cinq points: C, = (1, 0), Co = (2, 3), Ca = 
= (—1, 1), C, = (0, —1), C; =: (1, 2). La figure 8-2 donne la representation 
géométrique de ce jeu. 


Tableau 8-5 
W1 y? U3 ya Vs 
T{ | 2 —1 0 | 
Ta ( 3 1 —1 


Désignons par S* l'enveloppe convexe de l’ensemble fini des 
points {C,, -.., Cn} et démontrons le théorème qui dit qu'un 
S-jeu équivaut à un jeu ordinaire non seulement lorsqu'on utilise 
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des stratégies pures, mais aussi lorsque les stratégies adoptées sont 
mixtes. 

Théorème 8-3. Toute stratégie mixte du deuxième joueur peut 
être représentée par un point appartenant à l'enveloppe convexe S*, 
et vice versa, tout point S € S* peut être considéré comme une certaine 
stralégie mixte du deurième joueur. 

Démonstration. Considérons les stratégies mixtes £ — 


= (En, ..., E00) et n = (n, ..., n°”) des joueurs. Les pertes 
du deuxième joueur qui adopte les stratégies mixtes données seront : 
LE. n)= > D que — D gt D qu" = SES, (8-41) 
t L ? 
où 
SD = À qiunt”. (8-42) 
R 


Désignons par S un point' de coordonnées St?, ..., S® dans 
un espace à m dimensions où conformément à (8-42) 


SD = gun + + qi; 
ns (8-43) 
ST — Im" +... + JmnN 


Ayant en vue que (Qi, + +  Qmi) — Ci, les expressions (8-43) 
peuvent être écrites sous la forme d’une seule relation vectorielle 


S=Cinft +... + Can = À Cint?. (8-44) 


Compte tenu du fait que les grandeurs n'‘” vérifient les rela- 
tions (8-19), on voit que S n’est autre chose que la moyenne pondérée 
des points C3, ..-., Ch respectivement de poids nt‘, ..., n°” 
donc S est un point qui appartient à l'enveloppe convexe S*. De 
cette façon, à chaque stratégie n — (n‘"”, . .., n‘”) du deuxième 
joueur correspondra un certain point appartenant à l'enveloppe 
convexe S*, et la définition de ce point est équivalente à la définition 
de la stratégie mixte du deuxième joueur. 

Le contraire est aussi vrai. Etant donné que tout point S appar- 
tenant à l'enveloppe convexe S* peut être présenté comme la moyen- 
ne pondérée des points C,, ..., Cn, définissant l'enveloppe convexe 
S*, c.-à-d. peut être présenté sous la forme de l'expression (8-44), 


alors, pour chaque point S € S*, on trouvera des poids 1‘, ..., n‘” 
tels que leur définition détermine la stratégie mixte du deuxième 
joueur. 


Corollaire. Vu que la stratégie mixte du premier joueur 
reste dans un S-jeu la même que dans un jeu ordinaire, il découle 
du théorème qui vient d'être démontré qu'un S-jeu est tout à fait 
équivalent à un jeu ordinaire, c.-à-d. que n'importe quel jeu peut 
être présenté comme un $S-jeu équivalent. 
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Dans ce qui suit, le S-jeu sera désigné par F,. Pour passer du jeu 

= (E, H, L) au S-jeu, au lieu d'utiliser l’espace des stratégies 
mixtes du deuxième joueur H = {n;,, +, . . .} il faut faire appel 
à l’espace des S-stratégies, c.-à-d. à l'enveloppe convexe S*. Si l’on 
désigne les pertes du deuxième joueur dans le S-jeu par L,;, le S-jeu 
sera défini par le triplet E, S* et L,, les pertes L, devant être définies 
sur le produit direct E X S*. De cette façon. l'expression 


l,-(E. S*. L) (8-45) 


définit le S-jeu. En vertu de (8-41), la fonction de pertes Z, (& S) 
sera définie comme suit: 


Li (&. S)= D'ENS ES, (8-46) 


où par ES on désigne le produit scalaire des vecteurs 
E == (0, ..., Em) et S— (51, ..., St). 


b) Valeurs inférieure et supérieure du jeu 
dans un S-jeu 


Si le premier joueur adopte dans un S-jeu la stratégie mixte 
£ CE, son gain garanti sera: 


Ar, (£)= min L,(E, S):- min ES. (8-47) 
S 


Désignons par = (8, ..., 8) la stratégie du premier 
joueur pour Laquelle” Ar, (E) atteint son maximum. La valeur de 
Ar, (£) sera égale à la valeur inférieure du jeu &r, qui, en vertu de 
l'équivalence d'un S-jeu à un jeu ordinaire, coïncide avec &r. Donc 

ar = Ar, (£o) = max Ar, (E)— max minEs. (8-48) 
5 È  S 

La stratégie £, satisfaisant à la relation (8-48) est appelée stra- 
tégie minimaz du premier joueur. 

Supposons maintenant que le deuxième joueur adopte une cer- 
taine stratégie S € S*. Dans ce cas, la perte à laquelle il va se limiter 
sera 

Br, (S) — max L, (£. S)-- max ES. (3-49) 


Désignons par S; _ (s%, . Sim) le point de l'enveloppe 
convexe S* pour lequel | la grandeur Br, (S) atteint son minimum. 
La valeur de Br, (S,) sera égale à la valeur supérieure du jeu fr, 
qui, en vertu de l’équivalence d'un S-jeu à un jeu ordinaire, coin- 
cide avec Br. Donc 


Br = Br, (So) = min Br, (S) = mi n max ËS ES. (8-50) 
S 
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La stratégie S, satisfaisant à la relation (8-50) est appelée stra- 
tégie minimaxz du deuxième joueur. 

Les expressions de Br, (S) et de Br peuvent être mises sous une 
forme plus commode à l’aide du théorème ci-après. 

Théorème 8-4. Si S est un point arbitraire d’un espace à m dimen- 
sions et si E—(E#E, ..., EU) est une variable multidimensionnelle 
satisfaisant à la condition (8-16), ona la relation 


max ES -: max (St, ..., SM). (8-51) 
E 
Démonstration. Soit S'*'— max (Slt, ..., St"). 


Examinons la valeur particulière de £ correspondant au cas suivant: 


à {o pour ik; 
EU— 0 pour ik. 


Dans ce cas, ES — S‘*. De cette façon, S‘* est une valeur parti- 
culière du produit scalaire ES, donc un sous-ensemble de l’ensemble 
des valeurs ES obtenues pour toutes les valeurs possibles de E. En 
vertu du théorème de la borne supérieure d’un sous-ensemble, on 
trouve: 


(8-52) 


SM = max (51, ..., S') S max ES. (8-53) 
ë 
D'autre part, en substituant dans l'expression pour ëS aux gran- 
deurs St, ..., St" leur valeur maximale S'"*, on a: 
ES — Ÿ ANSE <S'" D Et = Si, (8-54) 
u 


Cette expression reste vraie pour tout Ë satisfaisant à la rela- 
tion (8-16), y compris le cas où ES atteint son maximum. En com- 
parant (8-53) à (8-54), on arrive à la relation (8-51). 

Le théorème qui vient d'être démontré nous permet de mettre 
l'expression de Br, (S) sous la forme 


Br, (S) — max ES - max (St, ..., 5). (8-55) 
ë 


De l'expression (8-55) on tire les corvllaires suivants. 
Corollaire 1. La condition fr < Br,(S) amène: 


Br max (51, .... SE), (8-6) 


Tout point S € S* possède au moins une coordonnée non infé- 
rieure (donc supérieure ou égale) à Br. 
Corollaire 2. En posant S = S, — (5. ..., S5) on 
obtient : 
Br —= Br, (So) — max (Sir, 7 SPP). (8-51) 


La valeur supérieure Br du jeu est égale à la coordonnée maximale 
du point S, qui définit la stratégie minimax du deuxième joueur. 
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c) Théorème de minimax 


La possibilité dont dispose chaque joueur de trouver sa meil- 
leure stratégie est basée sur le théorème suivant qui peut être consi- 
déré comme la démonstration de l’existence d’une solution pour les 
jeux finis. 

Théorème 8-5. Tout jeu fini a une valeur et chaque joueur dispose 
d'au moins une stratégie optimale. 

Prémisses de départ. Soient G—(X., Y, L) un 
jeu fini et l'--(E, H, L) le centrage de ce jeu. Lors de la démons- 

tration du théorème ïil sera commode de 


1L(2>,y) raisonner en termes d'un S-jeu. Pour cette 
} raison. désignons par FF, — (E. S*, Z.;) Île 
LT S-jeu équivalent. 


Les valeurs inférieure et supérieure du jeu 
L(zy) Seront respectivement égales à ar et à Br 
indépendamment de ce qu’on considère le jeu F 


NAT ee 

S SR ou le S-jeu équivalent l,. D'autre part, comme 
Nos TN « ? # LA Ld 

IR il a été démontré, ar < Br. 


pa Pour démontrer le théorème, il suffit de 
Fig. S-4. Domaine T . 

dans un espace bidi- Montrer que fr < @r, Car la confrontation 

mensionnel avec l'inégalité précédente entraîne œr—Br, 

ce qui signifie que le jeu a une valeur. Mais 

pour démontrer cette dernière inégalité, il suffit de trouver une stra- 

tégie mixte £, du premier joueur telle que pour tous les S € S* la 

relation ci-dessous ait lieu: 


Br<££oS, S ES. (5-58) 
En effet, si (8-58) a lieu, alors 
Br < min 09 = Âr (&o) = Gr. (8-59) 


Ainsi. la démonstration du théorème sera réduite à la démons- 
tration de l'inégalité (8-58). 

Démonstration. Considérons l’ensemble T comportant 
tous les points ? — (#1, ..., #0) tels que &* < Br pour i — 
= 0, 1, ..., m. Sur la figure 8-3 est représenté le domaine T pour 
un espace bidimensionnel. Dans ce cas, le domaine T a la forme d'un 
coin rectangulaire dont le sommet se situe sur la droite qui passe 
par l'origine des coordonnées et qui fait un angle de 45° avec la 
direction positive de l’axe des abscisses. Elucidons certaines pro- 
priétés de l’ensemble T7. 

L'ensemble T est un ensemble convexe. Considérons deux points 
arbitraires £, et £. de cet ensemble. L'équation du segment réu- 
nissant ces deux points sera de la forme 


= Wls+ Wolos Uile>O0; Wi+ui= 1. (8-60) 
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Projetant cette équation sur le i-ème axe et tenant compte du 
théorème 8-4, on obtient: 


1 = 1080) + nt) L'max (44, 17) Br. (8-61) 


Il s'ensuit que tout point du segment considéré appartient à 
l’ensemble T qui est donc un ensemble convexe. 

T et S* sont des ensembles disjoints. Cela découle du fait que tout 
point de l’ensemble S* a au moins une coordonnée supérieure ou 
égale à Br (voir le corollaire 1 du théorème 8-4), donc 7 et S* n'ont 
pas de points communs. 

Etant donné que T et S* sont les domaines convexes disjoints, 
il y a un hyperplan qui les sépare de façon que les ensembles T et S* 
se situent dans des demi-espaces différents définis par cet hyper- 
plan. Il existe donc un a — (a, ..., at”) et un nombre c tels 
que l'équation 

az = 0 (8-62) 


soit l’equation de cet hyperplan séparateur, avec 


aS >c pour er | 


at<c pour t€T. (8-63) 


Montrons que at” =>0,i—1, ..., m. Soit ô; = (6!, ..., 67) 
un point dont la i-ème coordonnée est égale à 1, toutes les autres 
ayant une petite valeur e => 0. Considérons le point $, € S*. Etant 
donné que sa coordonnée maximale est égale à Br (voir le corol- 
laire 2 du théorème 8-4), le point S, — 6; € T. Donc 


ass >c>a(Ss — Ôi). (8-64) 
Il s'ensuit que 
aô; = a +... Lam 0. (8-65) 


Si e +0, alors 6!” —+ 0, pour k à et 8% — 1. Cela étant, la 
dernière condition donne: 


aù >0, i=1,..., m. (8-66) 
Introduisons la notation 
Eo = (8-67) 


a 
ÿ ati) ° 
i 
Il est évident que £, € E, car 
EG ati) 
0 —_— 


> ati) 
L 


>0, DE. (8-68) 
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Introduisons en outre la notation 
€ . 
V = N'a . (8-69) 
+ 
Divisons les inégalités (8-63) par À; at”. Prenant en considéra- 
tion (8-67) et (8-69), on obtient : 

&o9 >-v pour cr.) 

Et< v pour {CT. 


Considérons le point f{, de coordonnées 4) = fr — €, e > 0, i — 
— 1,..., m. Il est évident que #, € 7. En vertu de la: deuxième 
des inégalités (8-70), on a: 


(8-70) 


Éoto & V- (8-71) 
Soit e —+0, de sorte que #') —f;. Alors 
Eto — X E640 + Br DRE Br. (8-72) 


i 


En comparant (8-71) à (8-72), on trouve: 


v > Br. (8-73) 
Dans ce cas, la première des inégalités (8-70) donne: 
ES > v > Pr, (8-74) 


ce qui démontre l'inégalité (8-58). 
De cette façon, v — ar — Br est la valeur du jeu, &, et S, repré- 
sentant les stratégies mixtes optimales des joueurs. 


d) Représentation géométrique du principe du minimax 


Montrons que le point $, qui définit la stratégie minimax du 
deuxième joueur est un point frontière du domaine S* et tel qu'en 
ce point le domaine 7 touche le domaine S*. 

Comme on J’a vu, S, = (S!, ..., SP)EST avec 


max (551, ..., 5,7) — Pre D'autre part, t — (n, ..., LM) € 
ET sito epni=t, m. 

Considérons le point S: = (SP — , 6 — €) où & > (0. 
Il est évident que max (Se - — E£, . , sm — ) < Br, de sorte 


que SD— 8 fr, i = 1,..., m. IL S ensuit que SE T. Mais 
lim 5, — So € SX, 
£—r 0 

D'ici on tire deux conclusions: 


1) S, est un point frontière du domaine S*; 
2) S, est un point de contact du domaine 7 avec le domaine S*. 
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Ces propriétés permettent de trouver facilement à l’aide d’une 
construction géométrique la stratégie minimax S$, pour le cas où 
le premier joueur dispose de deux stratégies pures, c.-à-d. lorsque 
le S-jeu équivalent est représenté par un ensemble de points situé 
dans le plan. Pour construire le domaine 7 tangent au domaine 
S*, il est commode de tracer sous un angle de 45° par rapport à l’axe 
des abscisses une droite passant par l’origine des coordonnées et 
portant le sommet du coin rectangle qui forme le domaine 7. 


L(X2,4) 


Points 
de minimax 


Points 
de rrinirmax 


LT}, y) 


Fig. 8-4. Détermination géométrique de la stratégie minimax 


Sur la figure 8-4 sont représentés divers cas de disposition réci- 
proque des domaines S* et 7 et sont marqués les points qui définis- 
sent la stratégie minimax S, du deuxième joueur. 


8-4. SOLUTION DES JEUX 


a) Stratégies dominantes et stratégies utiles 


On sait que les stratégies mixtes des joueurs représentent un 
mélange des stratégies pures x € X et yE Y prises conformément 
à la distribution de probabilités E (x) et n (y). Mais dans beaucoup 
de cas, il est de toute évidence que l'adoption de certaines straté- 
gies pures n’est pas rationnelle et, lors de la détermination de la 
stratégie mixte optimale, ces stratégies doivent tout simplement 
être écartées. Nous allons appeler stratégies utiles du joueur les stra- 
tégies pures qui contribuent à l'élaboration de sa stratégie mixte 
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optimale. Pour faciliter la séparation des stratégies utiles, introdui- 
sons la notion de stratégie dominante. 

Considérons deux stratégies y, et y du deuxième joueur. Sup- 
posons que le premier joueur adopte la stratégie z;. Les pertes du 
deuxième joueur seront respectivement égales à g;, et qi». Il se 
peut que pour n'importe quel à 


Qi SGips =, ...,m, (8-75) 
c.-à-d. que dans la matrice du jeu les pertes figurant dans la colonne ! 
ne dépassent pas les pertes correspondantes de la colonne p. Cela 


L(Z2, 9) 


Fig. S-5. Détermination de la dominance dans un S-jeu 


signifie que le deuxième joueur ne doit en aucun cas adopter la 
stratégie y,, car en l’adoptant il subira à coup sûr des pertes supé- 
rieures à celles qu’entraînerait la stratégie y,. C’est pourquoi la 
stratégie y, doit être écartée, c.-à-d. rayée de la matrice du jeu. La 
stratégie y, qui satisfait à la condition (8-75) est appelée stratégie 
dominante par rapport à la stratégie y. 

Les stratégies dominantes du deuxième joueur sont bien mises 
en évidence par une construction géométrique en passant au S-jeu 
équivalent dans le plan. Dans ce cas, m — 2 et la condition (8-75) 
s'écrira 

Gui Lips Jui L'upe (8-76) 


Sur la figure 8-5 sont donnés deux cas de disposition des points 
C; et C, correspondant aux stratégies pures y, et y, du deuxième 
joueur. On voit sans difficulté que, dans le cas représenté par la 
figure 8-5, a, la stratégie C, domine la stratégie C,, tandis que dans 
le cas de la figure 8-5, b, aucune des stratégies n’est une stratégie 
dominante. Pour que la stratégie y, domine la stratégie y,, le point 
C, doit se situer à gauche et plus bas par rapport au point C;. 

D'une façon analogue sont déterminées les stratégies dominantes 
du premier joueur. On dit que la stratégie x, domine la stratégie 
zh Si le gain du premier joueur, qui adopte la stratégie x;, est supé- 
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rieur aux gains apportés par l’utilisation de la stratégie x,, quelle 
que soit la stratégie y € Y: 


Gui>GQpir i=1d,...,n, (8-77) 


c.-à-d. si dans la matrice du jeu les pertes figurant dans la ligne 
x, Sont supérieures aux pertes correspondantes de la ligne x,. 


Eremple 8-3. Sur la figure 8-6, un S-jeu est donné dans le plan par les points 
C, à Ce. La figure montre que le point C, domine le point C;. tandis que les 
points C,, CA et Ce dominent le point C4. 
En écartant les points C; et C;, on arrive 
à un S-jeu défini par les points C1, Ce, Cas Ce 
parmi lesquels il n’y a pas de points domi- 
nants. 


En éliminant de la matrice du jeu 
les stratégies dominées par d’autres 
stratégies, on simplifie considérable- 
ment le jeu, donc la recherche de la 
stratégie optimale. Supposons mainte- Fig. 8-6. Exemple d’un S-jeu 
nant que dans le jeu considéré il n’y 
ait pas de stratégies dominantes. Dans ce cas, on peut se demander 
si toutes les stratégies sont utiles, c.-à-d. si elles sont utilisées 
toutes pour l’obtention de la stratégie mixte optimale. 


Adressons-nous au jeu représenté sur la figure 8-6. Après avoir éliminé les 
oints C, et C; dominés par d’autres points, on est arrivé au jeu représenté par 
es points C3, Ces Car Ce- Ayant construit le domaine 7, on voit que le point S,, 

qui définit la stratégie optimale du deuxième joueur, se situe sur la droite réu- 
nissant les points C, ct C. et peut être présenté comme la moyenne pondérée de 
ces deux points. De cette façon, la stratégie mixte optimale du deuxième joueur 
représente un mélange des stratégies pures y, et y, qui, dans ce cas. sont des 
stratégies utiles. Les stratégies ya et ys ne sont pas des stratégies utiles et leur 
utilisation n’est pas rationnelle. 


Le nombre total de stratégies utiles de chaque joueur peut être 
déterminé en partant du fait que l’enveloppe convexe S* d’un ensem- 
ble fini {C:, - .- ., C\,} est un polyèdre convexe dans un espace à m 
dimensions. Le point S,, qui est un point frontière du polyèdre 
convexe S*, appartiendra obligatoirement à une de ses faces dont 
les sommets correspondront aux stratégies utiles du deuxième joueur. 
Ayant en vue que le nombre de sommets de n'importe quelle face 
du polyèdre convexe S* ne peut pas être supérieur au nombre total 
de ses sommets, c.-à-d. à r, et ne peut pas dépasser la dimension de 
l’espace dans lequel se situe ce polyèdre convexe, c.-à-d. m, on arrive 
à la conclusion que le nombre de stratégies utiles du deuxième joueur 
n’est pas supérieur au plus petit des nombres m et n. Etant donné 
que les notions de premier et de deuxième joueur ne sont que con- 
ventionnelles, une conclusion analogue reste vraie également pour 
le premier joueur. 


17—0732 
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De cette façon, dans un jeu à matrice de dimension m X n le 
nombre de stratégies utiles de chacun des joueurs n'est pas supérieur 
au plus petit des nombres m et n. 

Théorème 8-6. Si un des joueurs suit en permanence sa stratégie 
mixte optimale, le gain des joueurs reste invariable et égal à la valeur 
du jeu v indépendamment de la stratégie mixte (ou pure) adoptée par 
l’autre joueur si seulement ce dernier ne sort pas du domaine comportant 
ses stratégies utiles. 

Démonstration. Soient v la valeur du jeu et £, — 
— (E°,..., &) la stratégie mixte optimale du premier joueur. 
Si ce dernier adopte sa stratégie optimale Ë,, son gain ne peut pas 
être inférieur à v. 

Supposons que le deuxième joueur dispose de À stratégies utiles 
désignées par ÿ1, - -., yr. Si le premier joueur adopte sa stratégie 
optimale £,, tandis que le deuxième utilise sa stratégie utile y; 
(i — 1, ..., k), alors le gain du premier joueur v; ne sera pas infé- 
reur à v: 


VIEN, Li = 1, ..., k. (8-78) 


Examinons maintenant la stratégie mixte optimale n, du deuxième 
joueur. Elle est donnée par les probabilités n{ avec lesquelles 
sont utilisées les stratégies utiles pures. Il est essentiel que l’on 
ne peut pas avoir nf) = O0 pour i = 1, ..., k, car, dans ce cas, la 
i-ème stratégie ne contribuerait pas à la formation de la stratégie 
mixte optimale du deuxième joueur, donc ne serait pas une straté- 
gie utile. 

Trouvons le gain moyen du premier joueur dans le cas où le 
deuxième adopte sa stratégie mixte optimale. Lorsque le deuxième 
joueur adopte sa stratégie mixte optimale n,, cela signifie que les 
gains Vy, + - ., V, Obtenus par le premier joueur correspondront 
aux stratégies pures Y, - «., yr Utilisées avec les probabilités 
nÿ, ..., n®. Le gain moyen du premier joueur sera donc égal à 


h 
Lm =: Van +... + van = Ÿ vin0). (8-79) 
_ 1 
En substituant v à v; et compte tenu de (8-78), on obtient : 


R 
Ln <v > no = v. (8-80) 


Mais le gain moyen obtenu lors de l’utilisation des stratégies 
optimales n’est autre chose que la valeur du jeu v, c.-à-d. 


Lm = Y. (8-81) 
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D'autre part, la relation (8-79) ne peut se transformer en (8-81) 
que si la condition 


V, = V, i = {, ... k. (8-82) 


est satisfaite, ce qui démontre le théorème. 

On voit de cette façon que le gain moyen du premier joueur, qui 
adopte sa stratégie mixte optimale, restera le même quelle, que soit 
la stratégie utile, et donc toute stratégie mixte composée de stra- 
tégies utiles, adoptée par le deuxième joueur. 

Il ne faut pas oublier qu’en toute circonstance l’utilisation de 
la stratégie mixte optimale est la plus avantageuse. L'adoption des 
stratégies utiles, même non optimales, ne cause pas de préjudices 
seulement dans le cas où l’adversaire suit sa stratégie optimale, 
tandis que l’utilisation de la stratégie optimale assure toujours un 
gain égal à la valeur du jeu. 

11 nous reste maintenant à examiner les procédés qui permettent 
de trouver les stratégies utiles et optimales des joueurs, c.-à-d. 
d'aboutir à la solution du jeu. 


b) Recherche des stratégies optimales 


Considérons un jeu G = (X, Ÿ, L) à matrice m *X n qui n’a 
pas de point-selle (dans le cas contraire, il est facile de trouver la 
solution du jeu selon la règle établie au paragraphe 8-2) et duquel 
on a éliminé les stratégies dominées par d’autres stratégies. 

Désignons par £, = (E!", ..., E"”) la stratégie mixte optimale 
du premier joueur. Certains El” peuvent être nuls, ce qui signifie 
que la stratégie correspondante x; n’est pas utile. Il nous faut trou- 
ver les valeurs de E{ÿ pour & == 1, ..., m. 

Supposons que le deuxième joueur utilise la stratégie y,. Si c’est 
une stratégie utile, le gain du premier joueur sera v, dans le cas 


contraire, il pourra dépasser cette valeur. Donc, dans le cas géné- 
ral, on a: 


(1) ! (mn) . 
L (Eos y): Eo un + +. -+ E0 Im XV. (8-S3) 


Des expressions pareilles peuvent être écrites pour chaque stra- 
tégie pure du deuxième joueur, c.-à-d. pour à — 1, ..., nr. On sait 
en outre que 


=(i e(! © ; 
0 >0, E0+...-LE Ut. (8-S4) 


Posons v >> 0. Cela sera toujours vrai si tous les éléments gq; 
de la matrice du jeu sont positifs. Si certains des éléments g;, sont 
négatifs, on peut les rendre positifs en ajoutant à tous les éléments 
de la matrice un certain nombre v’ >> 0. Dans ce cas, la valeur du 
jeu augmentera aussi de la quantité v’. 


17 


260 CH. 8. THÉORIE DES JEUX 


Divisons les équations (8-83) et (8-84) par v en notant 


50” 
Ÿ —= Di. (8-85) 


Il est évident que p; > 0. Dans ce cas, les inégalités (8-83) s’écri- 
ront, pour k# — 1, ..., n, sous la forme 


PiQu +... + Pmÿmi 215 ) 


res Ï (8-86) 
PiQin + --: + PmImn > 1, 
tandis que la relation (8-84) deviendra 
1 m” 
Pit... +Pm=—. (8-87) 


Les inégalités linéaires (8-86) contiennent les inconnues p1, .. 
«+. Pm Qui définissent la stratégie mixte du premier joueur. La 
détermination de la stratégie mixte optimale implique une telle solu- 
tion du système (8-86) pour laquelle la quantité v devient maximale 
et la forme linéaire (8-87) atteint donc son minimum. Mais c'est 
un problème ordinaire de programmation linéaire. 

Dans les expressions (8-86) il est plus commode de passer des 
inégalités aux égalités en soustrayant des seconds membres les 
inconnues additionnelles positives z;, ce qui aboutit au systeme 
d'équations 


Pitiit eo. + PmOmi—2i= 1, i — À, ... De (8-88) 


En résolvant les équations (8-88) correspondant aux stratégies 
utiles du deuxième joueur on obtient z; — 0. De cette façon, en 
résolvant le système (8-88) sous la condition de minimisation de la 
forme linéaire (8-87), on trouve la stratégie mixte du premier joueur, 
la valeur du jeu v et les stratégies utiles y,, . . ., y, du deuxième 
joueur. 

Pour trouver la stratégie mixte optimale du deuxième joueur 
No = (nf'?, .-.., n®) comportant k inconnues nf'), . .., nf, il 
est nécessaire de former À équations. Une de ces équations est 


ne... + ni. (8-89) 


Les autres À — 1 équations seront obtenues en formant les expres- 
sions des pertes moyennes pour la stratégie mixte optimale du 
deuxième joueur et pour n'importe quelles 4 — 1 stratégies utiles du 
premier joueur. Ainsi, pour la stratégie utile x; on aura l'équation 


ni: +... + nDqir = V. (8-90) 
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En formant k — 1 équations de la forme (8-90) et en leur ajoutant 
l'équation (8-89), on obtient 4 équations dont la résolution permet 
de trouver sans difficulté les quantités n£t), . .., n{* qui déter- 
minent la stratégie mixte optimale n, du deuxième joueur. 


Exemple 8-4. Trouver la solution du jeu dont la matrice est donnée par le 
tableau 8-6. 

Avant tout, il faut se convaincre que le jeu n’a pas de point-selle et qu'il 
n'y a pas de stratégies qui dominent autres stratégies. Pour éliminer les élé- 
ments négatifs de la matrice du jeu, ajoutons à chaque élément de la matrice 
e nombre 5. Alors, la matrice du jeu prendra la forme du tableau 8-7. 


Tableau 8-6 Tableau 8-7 
Durlele lee 
Zi 2 —3 4 ZT 7 2 9 
To —3 4 —5 Lo 2 9 0 
Ta 4 —5 6 T3 9 0 11 


Les équations (8-88) s'écriront sous la forme 
Tp1 + 2pa + Jps—4 = 1; 
2p1 + MPa — 22 = 1; 
9p1 + 11ps — 23 = 1. 
La solution de ces équations doit satisfaire à la condition de minimum de 
la forme linéaire (8-87) 
Pi + Pe + Ps = min. 
En résolvant le problème de programmation linéaire obtenu, on trouve: 
A = 2e = 23 = 0; pa = 0,05; pa = 0,1; pa = 0,05. 
On voit donc que toutes les trois stratégies y1, y: et y: sont des stratégies 
utiles. De l’expression (8-87) on tire: 
1 
"RARE 
Dans ce cas, 
EDS 5p—0,25; EM—5p=0,5; El= 5p3— 0,25. 


Pour trouver la stratégie mixte optimale du deuxième joueur, on compose 
une équation de la forme (8-89) 


go nfP + nf = 1 
et deux équations de la forme (8-90) pour les stratégies utiles du premier joueur 
Ze et ZT; 

206 + nb = 5; \ 

Qn£t + 110$ = 5. 
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En résolvant le système comportant les trois équations obtenues, on trouve : 
{ _— ne ee Li 
no = 16 =0,25; nf 0,5. 


Compte tenu du nombre 5 qui a été ajouté à chaque élément de la matrice, 
on trouve la valeur du jeu + — 5 - 0. 


c) Représentation géométrique du principe du minimax 
dans lejeu2 “n 


Dans le jeu 2 X n, la stratégie mixte du premier joueur repré- 
sente le couple ordonné E = (&, 1 — £). Si le deuxième joueur adop- 


Tableau 8-8 te la stratégie yr, alors le gain 
moyen du premier joueur sera 
| vi | ye | va L'(Ë, yr) = qu + (1 — Ë) qu = 
— Gr + É(qin — Gen), (8-91) 
TZ; 1 3 5 « . , . _» 
n ñ 9 ; c.-à-d. il dépend linéairement de 
u la grandeur &, comme le montre la 
figure 8-7. 


Examinons la détermination de la stratégie optimale £, à l’aide 
du jeu dont la matrice est donnée par le tableau 8-8. Sur la figure 
8-8 les chiffres 7, 2 et 3 désignent respectivement les lignes de 
gains pour les stratégies y,, y. et y; Le gain garanti du premier 


v] 
2 (Ë, ÿk) 4 
Grk 3 
ges 2 
1 
[a 
0 
Fig. 8-7. Ligne de gains pour Fig. 8-8. Stratégie minimax 
la stratégie y, dans le jeu 2: n 


joueur pour tout & sera déterminé par la borne inférieure (en 
trait fort) du graphique donné. Conformément au principe du 
minimax, la stratégie optimale &, doit assurer le gain garanti maxi- 
mal. Cette stratégie est déterminée par le point M situé à l’intersection 
des lignes de gains correspondant aux stratégies y, et y, qui, de cette 
façon, seront les stratégies utiles du deuxième joueur. 

La stratégie mixte optimale £, peut être trouvée en partant de 
la condition d'égalité du gain moyen du premier joueur lors de 
l’utilisation des stratégies utiles y, et y, du deuxième joueur 


Co + 4 (1 — Go) = 800 + 2 (1 — Lo), 
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ce qui donne Go — 1/2. Ainsi, £o — (1/2, 1/2). Maintenant, la va- 
leur du jeu sera trouvée en tant que gain moyen du premier joueur 
utilisant la stratégie E, pour n'importe quelle stratégie utile, par 
exemple y,, du deuxième joueur 


V = Co + 4 (1 — Lo) = 2,9. 


Si la valeur du jeu v est connue, la stratégie mixte optimale 
No = (n$, 1 — n;'', 0) du deuxième joueur sera trouvée en par- 
tant de l'expression des pertes moyennes du deuxième joueur pour 
n'importe quelle stratégie utile du premier joueur. Par exemple, 
pour la stratégie x,, on a: 


nt 3 (1 — nf) = 2,5, 
ce qui donne 1!” — 1/4. Donc, n, = (1/4, 3/4, 0). 


PROBLÈMES AU CHAPITRE 8 


8-1. Calculer la matrice de paiement pour le jeu de l'exemple 8-1. 

8-2. Calculer la matrice de paiement pour le jeu ci-après ayant dessiné au 
préalable l'arbre de ce jeu. 

On jette une pièce de monnaie symétrique et si le jet amène pile, le premier 
joueur choisit un des nombres 1, 6. Si le jet amène face, ce joueur choisit un des 
nombres 2, 7. Ensuite, le deuxième joueur choisit un des deux nombres 3, 9. 
Les nombres choisis par les joueurs sont additionnés et donnent la somme S$. 
Ensuite, on tire au sort avec la probabilité d'amener pile de 0,8. Si le sort amène 
pile. le deuxième joueur paie au premier S roubles, si c’est face, c’est le pre- 
mier joueur qui paie au deuxième S roubles. Le premier joueur connaît l'issue du 
premier coup aléatoire. Le deuxième joueur ne sait rien sur les coups précédents. 

8-3. Un mécanisme aléatoire commode à utiliser est offert par la position 
qu'occupe la trotteuse sur le cadran d’une montre à un instant donné choisi au 
hasard. Décrire l’utilisation de ce mécanisme aléatoire pour obtenir les distri- 
butions de probabilités suivantes: 


3 2 1 2 1 2 2 
(55) (555), (55.5). 
8-4. Décrire les actions des joueurs participant à une partie du jeu dont la 


matrice est donnée par le tableau 8-4 en sachant que le premicr joueur adopte la 
stratégie pure r, tandis que le deuxième utilise la stratégie mixten - (0,5. 0,5). 


CHAPITRE 9 


THÉORIE DES DÉCISIONS STATISTIQUES 
(JEUX STATISTIQUES) 


9-1. STRUCTURE DES JEUX STATISTIQUES 
a) Jeux stratégiques et jeux statistiques 


Un type spécifique de jeux particulièrement importants lors de 
l'analyse des différentes situations pratiques est représenté par les 
jeux dits statistiques. Ces jeux diffèrent essentiellement du type de 
jeux examinés jusqu'à présent qui pourraient être appelés jeux stra- 
tégiques. 

A la base de la théorie des jeux stratégiques on trouve l'hypothèse 
des intérêts diamétralement opposés de deux joueurs. Chacun des 
joueurs tâche de choisir sa stratégie de façon à s'assurer le profit 
maximal tout en réduisant au minimum le profit de l'adversaire. 
Dans de pareils jeux, chaque joueur agit activement et tend autant 
que possible à utiliser sa stratégie optimale. 

Pourtant, dans beaucoup de situations pratiques on rencontre 
des cas où l’un des joueurs est neutre, c.-à-d. qu'il ne tend pas à 
tirer le profit maximal, donc ne cherche pas à mettre à profit les 
erreurs commises par son adversaire. À ce type de jeux se rapportent 
les jeux dont un des participants est représenté par la nature. Ici, 
le mot « nature » signifie tout l’ensemble des circonstances exté- 
rieures qui déterminent la prise des décisions. 

La nature ne peut pas être considérée en tant qu'adversaire rai- 
sonnable capable de profiter des erreurs commises par l’homme. 
Autrement dit, la nature est sans mauvaise intention à l'égard de 
l'homme. Elle évolue et agit conformément à ses lois et c’est l’hom- 
me qui a la possibilité de mettre à son profit ces lois. Si l’homme 
connaissait parfaitement les lois de la nature, il pourrait en tirer 
l'avantage maximal. Mais dans beaucoup de cas, l’homme ne con- 
naît pas les lois de la nature ou les connaît insuffisamment. 

Le prix qu'il faut inévitablement payer en tâchant d'obtenir 
une décision, sans avoir une information complète sur la loi de la 
nature, consiste dans la possibilité de prendre des décisions erronées. 
D'autre part, les situations pratiques sont parfois telles qu'il est 
impossible de renoncer à la prise de décision. En outre, la décision 
de renoncer à la prise de décision est aussi une décision qui peut 
entraîner des conséquences non moins indésirables que celles entraî- 
nées par les autres décisions. L’unique possibilité de se tirer d’affaire 
dans cette situation réside en l'élaboration par l’homme d'une telle 
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stratégie de la prise de décision qui, tout en admettant l'éventualité 
d’une prise de décisions erronées, réduise au minimum les conséquen- 
ces indésirables qui en découlent. 

Il est vrai que l’homme peut encore étudier son adversaire (la 
nature) en faisant des expériences. 

Théoriquement, en faisant des expériences non limitées, on peut 
compléter autant que l’on veut ses connaissances de la nature pour 
agir ensuite en toute netteté, mais deux circonstances s’y oppo- 
sent : 

les expériences nécessitent du temps, tandis que dans beaucoup 
de cas la décision doit être prise rapidement : 

les expériences impliquent des frais, donc peuvent coûter plus 
cher que l’avantage apporté par le surplus de connaissances qu’elles 
fournissent. 

C'est pourquoi, dans le jeu de l’homme contre la « nature », 
un problème important est constitué par la prise de décision concer- 
nant les expériences: faut-il les faire, et, s’il le faut, quelles sont 
les expériences qu'il faut faire, quand doit-on les arrêter et quel- 
les sont les actions à entreprendre une fois les expériences 
finies ? 

Les jeux où l’un des adversaires est la nature, l’autre étant 
l'homme, ont été appelés jeux statistiques, leur théorie étant dite 
théorie des décisions statistiques (54, 57, 58]. L'homme qui participe 
au jeu sera appelé, dans ce qui suit, sfatisticien. 


b) Espace des stratégies de la nature 


Par stratégie de la nature nous allons entendre l’ensemble com- 
plet des conditions extérieures présentes à la prise d’une décision. 
Cet ensemble des conditions extérieures sera appelé état de la natu- 
re Ÿ. Dans le cas général, il existe un certain ensemble des états 
possibles de la nature 6 — {8,, ..., d,} qui, comme il a été con- 
venu au chapitre 6, s’appellera espace des états de la nature. Les 
éléments Ÿ; de cet espace seront les stratégies pures de la nature. 

Si nous savions au préalable la stratégie pure que la nature 
va adopter dans chaque cas concret, nous prendrions la décision 
avec certitude ayant une connaissance parfaite de l’état de la nature. 
Mais d'habitude, on ne connaît que la collection de stratégies pures 
de la nature. En outre, l'expérience passée nous apprend la fréquence 
à laquelle la nature adopte telle ou telle stratégie pure dont elle 
dispose, c.-à-d. on connaît la distribution a priori de probabilités 
ë (8) sur l’espace des états de la nature 6. Cette distribution a 
priori de probabilités E(9) sera appelée stratégie mixte de la 
nature. 
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c) Espace des stratégies du statisticien 
et fonction de pertes 


Le problème que le statisticien doit résoudre consiste dans la 
prise d'une certaine décision ou dans l’exécution d'une certaine ac- 
tion appartenant à l’ensemble des décisions ou des actions. 

Désignons les actions possibles du statisticien par a,;, ..., a. 
Chacune de ces actions est une stratégie pure du statisticien. L'en- 
semble À — { a,. ..., a,;} est l’espace des stratégies pures du statis- 
licien. 

Le statisticien doit pouvoir estimer chacune de ses actions. 
Pour cela, il admet qu'en accomplissant l’action a, il peut encourir 
la perte L (Ÿ, a) qui est fonction aussi bien de l’action exécutée a 
que de l’état de la nature Ÿ que le statisticien ignore. La fonction 
L (Ÿ, a), appelée fonction de pertes, doit être définie à l’avance pour 
toutes les combinaisons a € À et Ÿ € 9 possibles, c.-a-d. doit être 
donnée sur le produit direct des ensembles 6 X 4. Elle peut être 
donnée analytiquement, ou bien, par analogie à (8-7), à l’aide d'une 
matrice de paiement de la forme 


Jus + -- Qi 
Q=|| Gil = _........ , (9-1) 
m1 - +. mit 


où g;j — L (Ÿ;, a;j). La connaissance de la fonction de pertes permet 
au statisticien de prendre les mesures les plus indiquées compte 
tenu de l'information qu'il possède sur l’état de la nature. 
D'habitude, le statisticien connaît la stratégie mixte de la natu- 
re, C.-à-d. la distribution a priori de probabilités & (®) sur l’espace 
des états de la nature 6. La connaissance de la distribution a priori 
de probabilités donne la possibilité de déterminer les pertes moyennes 
subies par le statisticien qui entreprend telle ou telle action: 


L(E. a)--MIL($, a)}]= Ÿ L(., a)E(#). (9-2) 
ce 


L'action la plus favorable pour le statisticien sera l’action dite 
de Bayes a* pour laquelle les pertes seront minimales et égales à 


R' (= L(E. a°)= min LE, a). (9-5) 


Il n’est pas obligatoire que le statisticien se borne à une seule 
stratégie pure. [l peut aussi utiliser un mélange de stratégies pures 
conformément à une certaine loi de distribution de probabilités. 
Dans ce cas, il sera question de la stratégie mixte du statisticien. Pour 
utiliser une stratégie mixte, le statisticien doit se donner la distri- 
bution de probabilités n (a) — (n‘”, ..., n‘””) qui définit les pro- 
babilités avec lesquelles il doit utiliser ses stratégies pures a, . .. 
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... Am. Dans le cas général, le statisticien dispose d'une certaine 
collection de stratégies mixtes H — {n, (a), ..., n, (a)} appelée 
espace des stratégies mixtes du statisticien. 

Si le statisticien adopte la stratégie mixte n (a), tandis que la 
nature utilise la stratégie mixte & (Ô), les pertes moyennes du statis- 
ticien seront 

LE, 1): Mo, [L (8, a) = À 
ô. 


a 


L (ÿ. a) 5: (Ÿ) n (a). (9-4) 


Dans ce cas, la tâche que s'impose le statisticien consiste à choi- 
sir une stratégie n* (a) € IL telle que ses pertes moyennes L (£, n*) 
soient minimales, c.-àa-d. 


L(E. n*)= min L (£. n).4 (9-5) 
neH 


Les cas qui viennent d'être exposés impliquent fa résolution d’un 
problème statistique relativement simple consistant dans la déter- 
mination de la meilleure stratégie du statisticien sur la base seule- 
ment de l’information a priori qu'il possède sur les états de la nature. 
Ici, le statisticien ne tâche pas de préciser l’état réel de la nature en 
faisant des expériences. C’est pourquoi ce type de jeu statistique 
peut être appelé jeu statistique sans expérience. 


d) Exemples de jeux statistiques 


Pour mieux comprendre la structure des jeux statistiques et 
les méthodes de résolution utilisées, nous allons donner quelques 
exemples qui nous serviront en même temps d'illustration aux points 
fondamentaux de la théorie des décisions statistiques. 


Exemple 9-1. Problème du remplacement de l'équipement. L'équipement 
complexe et coûteux d’une entreprise ayant servi pendant k ans peut se trouver 
dans l'un des trois états suivants: 

Ÿ,: l'équipement peut rester en service et ne nécessite qu’une petite répara- 
tion courante ; 

Ÿ,: certaines pièces sont considérablement usées et nécessitent une répara- 
tion importante ou bien doivent être remplacées ; 

®.,: les pièces principales sont tellement usées que l'utilisation ultérieure 
de l'équipement est impossible. 

L'expérience passée acquise dans le domaine d'exploitation d’un équipe- 
ment analogue montre que l’état 0, caractérise 20 " des cas, l’état D, 50 % et 
l'état D, 30 Vo. 

L'entreprise peut choisir l'une des trois voies suivantes : 

a, : utiliser l’ancien équipement pendant une année en effectuant une répa- 
ration peu importante par ses propres moyens; 

a,: effectuer une grosse réparation de l'équipement à l’aide d’une équipe 
spécialisée ; 

a: remplacer l'équipement ancien par un équipement neuf. 

Les pertes subies par l’entreprise et correspondant aux différentes voies 
sont données au tableau 9-1. Ces pertes incluent les frais de réparation ou de 
remplacement de l'équipement de même que les dommages liés à la baisse de 
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la qualité de la production et au temps mort dü aux pannes de l'équipement. Au 
même tableau on trouve les probabilités a priori des différents états de la na- 
ture, autrement dit, la stratégie mixte E (0) de la nature. 


Tableau 9-1 Tableau 9-2 
Probabilités a priori des états de la Probabilités a priori des états de la 
nature et pertes dans le problème nature et pertes dans le problème 
du remplacement de l’équipement de la ligne technologique 
A 
Ô E (6) Ÿ 5 (0) 
u | ae | az 
Ÿ 0,2 1 3 5 ô, 0,6 0 
2 0,5 5 2 4 3 , 
d: 0,3 7 | 6 | 3 Us | 0,4 9 ? 


Pour la stratégie mixte donnée £& (0). les pertes moyennes correspondant 
aux différentes voies adoptées sont : 


LE, a)= D L (0, a) (0): 1-0,2--5.0,5-L7-0,3 = 4,8: 
L(&,a)=34 LE, 43,9. 


Exemple 9-2. Problème de la ligne technologique. Une ligne technologique 
peut recevoir de la matière première contenant peu (#,) ou beaucoup (Ÿ,) d’im- 
puretés. On sait qu’en moyenne la ligne reçoit 60 % de matière première du 
premier type et 40 % du deuxième. Pour utiliser des différents types de matière 
première, la ligne technologique peut fonctionner en un des trois régimes a,, a, 
et as. Les probabilités a priori des états de la nature et les pertes reflétant la 
qualité du produit fabriqué et la consommation de matière première en fonction 
de la qualité de cette dernière et du régime de fonctionnement de la ligne techno- 
logique sont données au tableau 9-2. 

Les pertes moyennes correspondant aux probabilités a priori données pour 
les différents régimes de fonctionnement sont : 

L'(E, a) — 2,0; L (Ë, a) — 1,8; L (8, az) — 2,6. 


L'action de Bayes correspondra au régime de fonctionnement a.. 


9-2. JEUX STATISTIQUES SANS EXPÉRIENCE 


a) Représentation d’un jeu statistique sans expérience 
sous la forme d’un S-jeu 


Un jeu statistique peut être représenté sous la forme d'un S-jeu 
équivalent d'une façon absolument analogue à celle examinée dans 
le cas des jeux stratégiques. Pour ce faire, à chaque stratégie pure 
a;(j = 1, ..., 1) on associe un point C; — (qij, . .- ., {mj) Aans un 
espace à m dimensions dont les coordonnées seront représentées 
par les pertes du statisticien ZL (Ÿ;, a;) = q:, pour les différents états 
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de la nature Ÿ; (i — 1, ..., m). Ainsi, dans le cas du problème de 
la ligne technologique, aux stratégies pures du statisticien a,, a, et 
a, seront associés les points C;,—(0,5), C: — (1,3) et C:—1(3,2) du plan, 
comme on le voit sur la figure 9-1. L’enveloppe 
convexe S* de l’ensemble des points {C:, 
C», Ca} définit le domaine de toutes les stra- 
tégies possibles (pures et mixtes) du statis- 
ticien. 

Dans ce qui suit, nous allons examiner 
certains principes qui peuvent guider le sta- 
tisticien lors du choix de sa stratégie. Il faut 
quand même remarquer que les statisticiens 


pe sont pas unanimes sur le meilleur de ces / LIU, a) 
principes lorsqu'il s’agit des jeux statistiques. 5 > 
Autrement dit, il n’y a pas de règle universelle 2 3 


permettant de choisir une certaine façon d'agir Pie < 
2 J- . . . A ig. 9-1. Representa- 
indépendamment de la situation qui Se Pré- tion du problème de 
sente. Toutefois, quoiqu'il puisse y avoir des la ligne technologique 
divergences sur les actions à entreprendre dans sous la forme d’un S-jeu 
une situation donnée, on peut arriver à un 

accord complet sur les actions qui sont à bannir. Pour cela, 
il faut introduire Ja notion de stratégie admissible analogue à la 
notion de stratégie dominante dans les jeux stratégiques. 


b) Stratégies admissibles dans les jeux statistiques 


Supposons que nous soyons en train d'examiner la stratégie 
mixte n (a) du statisticien. Deux cas peuvent se présenter : 

1) Il est impossible de trouver une stratégie meilleure que n (a). 
Cels signifie qu’il n’existe aucune stratégie n’ (a) telle que 


L (8, n) < L(8, 1) (96) 


pour tous les Ÿ € 6, bien que, pour certains #, la relation (9-6) soit 
vraie. Dans ce cas, la stratégie n (a) peut être appelée stratégie admis- 
sible. Mais il n’est pas obligatoire que cette stratégie soit préférable, 
car d'autres stratégies peuvent aussi être prises en considération. 

2) Il y a une stratégie n° (a) qui est meilleure que n (a). Cela veut 
dire que, pour la stratégie n’ (a), la relation (9-6) sera vraie pour tous 
les Ÿ € ©. Dans ce cas, la stratégie n (a) doit céder la place à la stra- 
tégie n” (a) et être considérée comme stratégie inadmissible. 

Les stratégies admissibles sont commodes à examiner en termes 
d'un S-jeu. Etant donné que dans un S-jeu la stratégie du statisticien 
est définie par le point S de l'enveloppe convexe S*, tandis que les 
pertes pour différents Ÿ € 6 sont définies par les coordonnées de ce 
point, la stratégie définie par le point S sera une stratégie admissible 
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s'il n’y a aucun point SE S* dont toutes les coordonnées seront 
inférieures aux coordonnées respectives du point S. 

Examinons la methode qui permet de trouver les stratégies admis- 
sibles pour le cas où l’espace des états de la nature ne comporte que 
deux éléments ®, et Ÿ.. Sur la figure 9-2 est montré le domaine con- 
vexe S* correspondant au cas considéré. 

Examinons la stratégie définie par le point $, qui est un point 
intérieur du domaine S*. Cette stratégie n'est pas une stratégie admis- 
sible, car tous les points situés sur le segment OS, 
à l’intérieur du domaine S* définissent des stra- 
tégies meilleures que $,. La meilleure de ces 
stratégies est la stratégie S qui appartient à la 
borne inférieure gauche du domaine S*. Pour 
cette raison, tous les points intérieurs peuvent 
être éliminés en faveur des points constituant la 
frontière inférieure gauche du domaine S* tracée 
sur la figure 9-2 en trait fort. 


Fig. 9-2. Stratégies Mais le déplacement du point le long de cette 
admissibles dans frontière n'apporte aucun avantage, car la dimi- 
un S-jeu nution des pertes correspondant à un état de la 


nature est accompagnée de l’augmentation des 
pertes correspondant à l'autre état de la nature. C’est pourquoi les 
points appartenant à la frontière inférieure gauche du domaine S* 
définissent justement les stratégies admissibles du statisticien. 


Exemple 9-3. Dans le problème de la ligne technologique (voir fig. 9-1), la 
frontière inférieure gauche du domaine S* comporte les segments C,C, et 
C:C3 dont chacun est déterminé par un mélange de stratégies pures a,. a, et 
ds, 43. Soit 0 < &w << 1. Alors l’équation du segment C,C, s’écrira sous forme 
vectorielle comme suit: 

S = wC; — (1 — w) Ca. (9-7) 

Cette équation définit la stratégie mixte n (a) -- (u, 1 — x, 0). En proje- 
tant l’équation du segment C,C, sur les axes de coordonnées, on obtient : 

L (03, n)=0w0+1({—w)—1—w; À 
L (%, n) = 5w +43 (1 —1w) —3+ 2. 

D'une façon analogue. l’équation du segment C.C, qui définit la stratégie 

mixte n (a) =: (0, w, 1 — ww) se réduit à la forme 
L (8, n)—2+w. 


(9-8) 


(9-9) 


c) Principes de choix des stratégies 
dans les jeux statistiques 


On appelle principe de choix une règle qui permet de déterminer 
la meilleure stratégie mixte du statisticien. En différentes circons- 
tances, le statisticien peut faire appel aux différents principes de 
choix de sa stratégie. 


=] 
nd 
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Un des principes possibles du choix de la stratégie peut être le 
principe du minimazx. Ce principe est utilisé avec profit dans les jeux 
stratégiques lorsqu'on a affaire à un adversaire raisonnable qui dé- 
sire nous infliger la perte maximale. Quand même, dans certaines 
circonstances, il est également rationnel d'utiliser ce principe dans 
les jeux statistiques. | 

Conformément au principe du minimax, le statisticien doit chot- 
sir une stratégie mixte n (a) telle que les pertes moyennes L (Ÿ, n) 
soient minimales, l’état de la nature ® lui étant le plus défavorable. 
Le pire des cas se présentera lorsque 8 € 6 va déterminer le maximum 
de la quantité L (Ÿ, n). C'est 


justement cette quantité SLA 2) 
que Je statisticien doit 4 
minimiser, c.-à-d. choisir la 7 Æ 
stratégie n* (a) qui assure la 2 
condition / URS 
l 7 
. { ES CS D 
L(Ÿ.n*)=min max Z (Ÿ,n). g r 
n F b) 


(9-10) 
Fig. 9-3. Détermination de la stratégie opti- 


Exemple 9-4. Trouvons la 
stratégie minimax dans Île pro- 
blème de la ligne technologique. 


male suivant le principe du minimax (a—cor- 
respond au segment C, C.; b — au segment 
C:C; sur la figure 9-1) 


Etant donné que la solution doit 
se trouver dans la classe des 
stratégies admissibles, on peut se borner à l'examen des stratégies définies par 
les relations (9-8) et (9-9) et correspondant aux segments C,C, et C.C;4 de l’enve- 
loppe convexe S* représentée sur la figure 9-1. En conformité avec ces relations 
et ces segments, sur les figures 9-3, a et 9-3, b on a construit les graphiques de 
variation Z (Ÿ, n) en fonction de & pour Ÿ := #, et Ô — Ô.. Les valeurs de 
max L (®, n) sont tracées en trait fort. Les graphiques montrent que le minimum 


de cette grandeur sur le segment CC, est atteint pour & — 0 et est égal à 3; 
sur le segment C,C:3 le minimum est défini par la condition d’intersection de 
deux droites 


3 — 2w — 2 -- w, 


ce qui veut dire qu'il a lieu pour & :- 1/3 et est égal à 7/3 << 3. Ainsi, le principe 
du minimax nous donne le point situé sur le segment C,C; et correspondant à 
uw =. 1/3, c.-à-d. définit la stratégie mixte optimale n* = (0, 1/3, 2/3) pour 
laquelle les pertes du statisticien ne dépasseront pas 7/3, quelle que sait la stra- 
tégie de la nature. 


Parfois, il est rationnel de choisir la stratégie en partant des per- 
tes dites supplémentaires L’ (Ÿ, a) au lieu de s'appuyer sur les pertes 


totales ZL (8, a). Les pertes supplémentaires sont définies par la re- 
lation 


L'(Ÿ,a)=ZL($, a) — min L(Ÿ, a). (9-11} 
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Pour chaque état de la nature, la grandeur min L (#, a) déter- 


a 

mine les pertes minimales que le statisticien doit obligatoirement 
subir (pertes nécessaires), même si ses actions sont les meilleures. 
On peut considérer que les pertes nécessaires sont compensées d’une 
façon ou d’une autre (en fixant, par exemple, des prix adéquats pour 
les biens fabriqués) et, par conséquent, peuvent être négligées lors 
du choix de la stratégie. Dans ce cas, le choix de la stratégie peut se 
faire suivant le principe du minimazx des pertes supplémentaires. 


Eremple 9-5. Les pertes supplémentaires dans le problème de la ligne tech- 
nologique trouvées à l’aide de la relation (9-11) sont résumécs dans le tableau 9-3. 
En appliquant à ce tableau le principe du 


Tableau 9-3 minimax, on obtient comme stratégie optimale 

Pertes supplémentaires la stratégie pure as dont les pertes sont égales à 1. 
dans le problème de la ligne 

technologique Les principes du minimax, partant 

de l'hypothèse que la nature agit de la 

A façon la plus défavorable pour le statis- 

Ÿ ticien, se trouvent justifiés dans les jeux 

441 °2 53 stratégiques, tandis que dans les jeux sta- 

tistiques ils expriment, dans le fond, le 

ô, 0 1 3 point de vue d’une personne très prudente 

0 3 1 0 qui s'efforce d'obtenir au moins ce qui 


est accessible, sans tâcher d'atteindre le 

maximum pour ne pas subir accidentelle- 
ment des pertes plus importantes. Un autre inconvénient des prin- 
cipes du minimax consiste dans le fait qu'ils ne tiennent pas compte 
de l’information a priori sur les états de la nature en limitant ainsi 
le gain que cette information pourrait fournir. 

Pour cette raison, les principes du minimax peuvent être recom- 
mandés dans les cas où il n’y a pas d’information a priori sur les états 
de la nature ou bien si cette information est douteuse. 

Un autre principe de choix de la stratégie qui prend en considé- 
ration la distribution a priori de probabilités E (9) est le principe de 
Bayes. Conformément à ce principe, l’estimation de la stratégie mixte 
n (a) du statisticien se fait en prenant la moyenne des pertes ZL (8, n) 
suivant tous les états possibles de la nature Ÿ € © compte tenu de la 
distribution a priori de probabilités & (0), c.-à-d. suivant la grandeur 


L (E, n) = ù L (Ÿ, n)E (8). (9-12) 


Dans ces conditions, la meilleure stratégie n (a) sera celle qui 
assure le minimum de la grandeur Z (£, n). Elle sera appelée straté- 
gie de Bayes. 

Le principe de Bayes peut être, bien entendu, appliqué aussi bien 
aux pertes totales qu’aux pertes supplémentaires, mais, dans les 
exemples qui suivent, nous n’allons l’appliquer qu'aux pertes totales. 
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Exemple 9-6. Dans le problème de la ligne technologique, pour & ë (0,) = 
= 0,6 et É (02) = 0,4 utilisées pour les stratégies admissibles définies par le 
segment CiCo, On a: 
L (6, n) = (1 — w) 0,6 + (3 + 2w) 0,4 = 1,8 + 2,0w, 

de sorte que min L (ë, n) = 1,8 pour w = 0, ce qui correspond à la stratégie 

w 
mixte n = (0, 1, 0); pour le segment C:C;: 

L (E, n) = 2,6 —0,8w, 

de sorte que min L (£, n) = 1,8 pour w = 1, ce qui correspond à la même stra- 

w 


tégie mixte 7 — (0, 1, D. De cette façon, la stratégie de Bayes est représentée 
par la stratégie pure a; 

Il est à remarquer que le résultat obtenu n'est pas fortuit. Plus loin nous 
allons montrer que le principe de Bayes donne toujours comme la meilleure 
stratégie une des strategies pures du statisticien, l’action de Bayes a* étant 
définie par la condition (9-3). 


d) Interprétation géométrique des stratégies de Bayes 


Examinons un S-jeu statistique pour deux états de la nature #, 
et Ô. défini par le domaine convexe S* du plan (x, y) représenté sur 
la figure 9-4, où 


z = L(G,,n); y = L(8:, n). (9-13) 


On sait que les stratégies admissibles se situent sur la frontière 
inférieure gauche du domaine S*. Considérons une des stratégies 
admissibles S,. Construisons l’ensemble 
auxiliaire À contenant tous les points situés 
au-dessous et à gauche du point S,. Il est 
évident que S* et R sont des ensembles 
convexes et qu'aucun point de S* n'appar- 
tient à À, y compris le point S:. 

Construisons la droite qui sépare les 
ensembles S* et À. Cette droite doit passer 
par le point $S,, c.-à-d. doit être une droite 
d'appui à l'ensemble S* au point So: Mais Fig. 9-4. Construction de 
elle doit en même temps être une droite j3 "ligne d'appui à un 
d'appui à l’ensemble R. Donc, elle doit ensemble convexe 
avoir une pente négative, ou être verti- 
cale, ou bien être horizontale et son équation peut s’écrire 


y=—kr+e, k>0 (9-14) 


En divisant les deux membres de cette équation par 4 + 1, 
ramenons-la à la forme 


y=Li0,,7) 


az+by=c", (9-15) 
où 4 
k r__ € 
FT : b=: CFE T" (9-16) 


18—0732 
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En observant que a > 0, b > 0, a + b — 1 on peut poser a — 
= w, b = Î — w et considérer w et 1 — w en tant que distributions 


a priori des états de la nature Ÿ, et Ÿ.: 


w = E (0), 1 — w — E (6). (9-17) 
Dans ce cas, l'équation de la droite d'appui peut s’écrire 
wz + (1 —w)y = c (9-18) 
ou 
L (da, n)E (81) + L (02. n)E(M)= 0". (9-19) 


On voit donc que la grandeur c” détermine les pertes moyennes 
L (£, n) pour les probabilités a priori d'états de la nature & (Ù,) — 
— w et E (0.) = 1 — w. D'autre part, il n’est pas difficile de remar- 
quer que, pour le point S,, la grandeur c’ est minimale de toutes les 
valeurs possibles de ZL (£.n), car si c’ augmente iusqu’à c” >> c”, cela 
signifie que la droite va passer plus haut par des points appartenant 
à l’ensemble S*, donc inadmissibles, tandis qu'une diminution de 
c’ n’est pas possible vu que, dans ce cas, la droite passera plus bas 
et n’aura plus de points communs avec S*. De cette façon, la gran- 
deur c’ définit la stratégie n qui donne le minimum des pertes moyen- 
nes ZL(E, n) pour la distribution considérée & (Ô) = (w, 1 — w), 
c.-à-d. définit la stratégie de Bayes pour Ia distribution a priori de 
probabilités donnée. 

Etant donné que S$, est un point arbitraire situé sur la frontière 
des stratégies admissibles, on peut trouver pour tout point de cette 
frontière des w et 1 — w tels que ce point définisse la stratégie de 
Bayes. Il s'ensuit que, pour certaines probabilités a priori w et 1 —:1r, 
chaque stratégie admissible est une stratégie de Bayes. 

Supposons maintenant données les probabilités a priori d'états 
de la nature w et 1 — w; on demande de trouver, pour ce cas, le 
point de l’enveloppe convexe S*, qui définit la stratégie de Bayes. 
Construisons sur le plan (x, y) la droite 


wz + (—w)y = c. (9-20) 


Pour un c arbitraire, cette droite sera parallèle à la droite d'appui 
passant par le point correspondant à la stratégie de Bayes. Pour ren- 
dre la construction plus aisée, posons c = w (1 — w) et écrivons 
l'équation (9-20) comme suit: 

— + 1 1, (9-21) 


1—1w uw 


On obtient ainsi l’équation aux segments de la droite représentée 
sur la figure 9-5. Il est facile maintenant de construire la droite d’ap- 
pui correspondant aux valeurs données de w et 1 — w, droite qui 
définira sur l’enveloppe convexe S* Je point correspondant à la 
stratégie de Bayes du statisticien. 
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Vu que la frontière exterieure de l'enveloppe convexe représente 
un polygone dont les sommets correspondent aux stratégies pures du 
statisticien, la droite d'appui doit obligatoirement passer par au 
moins un de ces sommets. Donc, pour les 
probabilités a priori données w et 1 — w, il 
existe toujours au moins une stratégie de 
Bayes qui est une stratégie pure. Cette circons- 
tance simplifie beaucoup la résolution des 
jeux statistiques, car, en cherchant la solu- 
tion de Bayes, on peut limiter la recherche 
à un nombre fini de stratégies admissibles 
pures au lieu d'examiner une infinité de stra- hi, 95. Détermina- 
tégies mixtes. Cela arrange aussi beaucoup tion géométrique de 
de statisticiens sceptiques qui hésitent d'’uti- la stratégie de Bayes 
liser les stratégies mixtes en prétextant qu'elles 
impliquent la mise en jeu d’un mécanisme aléatoire qui n’a 
aucun rapport au fond du problème. 

Bien entendu, toutes les conclusions tirées restent vraies pour le 
cas où il y a plus de deux états de la nature, mais l'interprétation 
géométrique devient alors plus difficile, car l'examen du problème 
dans le plan est impossible. 
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a) Position du problème 


Comme on l’a déjà remarqué auparavant, une des particularités 
des jeux statistiques consiste dans le fait que le statisticien peut 
élargir et préciser ses connaissances relatives à l’état de la nature 
en faisant des expériences. En principe, si les expériences pouvaient 
être continuées sans aucune limitation, le statisticien pourrait 
obtenir une information complète sur l’état de la nature, ce qui lui 
permettrait d’agir en toute netteté. Pourtant, les frais entraînés 
par les expériences peuvent s'avérer supérieurs au gain qu'elles appor- 
teraient. 

La possibilité de faire des expériences élargit énormément la 
classe de stratégies du statisticien. Avant tout, ce dernier doit décider 
si les expériences doivent être faites ou non. Ensuite, il doit 
déterminer la nature des expériences, leur nombre et les actions 
qu’il faut entreprendre en fonction des résultats obtenus. 

Aux paragraphes suivants, nous tâcherons de répondre à certaines 
de ces questions, le présent paragraphe étant consacré aux jeux sta- 
tistiques à expérience unique. 

Pour le moment, nous n’allons pas inclure dans la classe des stra- 
tégies du statisticien la prise de décision sur les expériences en con- 
sidérant que la décision de faire une expérience unique est déjà 


18° 
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prise. Avec cela, nous allons entendre par expérience unique une expé- 
rience dont le volume et l’ordre d’exécution sont définis à l’avance. 
Ainsi, s’il faut vérifier si une pièce de monnaie est symétrique, on 
peut faire une expérience unique comportant x jets de cette pièce. 
Pour nr = 9, l'issue de l'expérience peut être exprimée par la suite 
PFPPF. En tout, il y a 2" suites de ce type, ce qui signifie que, dans 
ce cas, l’espace des issues de l'expérience comporte 2* éléments. 
D'une façon analogue, lorsqu'on vérifie une arme, on entend par 
expérience unique une expérience où l’on tire z coups. Pour estimer 
l'influence exercée par une certaine nourriture spéciale sur un animal, 
on peut faire une expérience unique qui consiste à mesurer journelle- 
ment pendant plusieurs mois l'augmentation de poids chez r animaux, 
etc. Bien que l'expérience des exemples cités comprenne une série 
d'épreuves, nous l’appelons expérience unique étant donné que le 
nombre d'épreuves et le caractère de chacune d'elles sont définis 
à l'avance. 


b) Espace d’échantillonnage 


Désignons par Z l’espace des issues de l’expérience et par 3,, . .. 
..., Z, les éléments de cet espace (issues isolées de l’expérience). 

Les issues isolées z € Z de l’expérience sont liées aux états de la 
nature Ÿ € © par lé fait qu’à chaque état de la nature correspond une 
probabilité déterminée p4 (z) que l'issue de l'expérience sera l'issue 
z € Z donnée. Les grandeurs py (z), notées encore p (z | 8), repré- 
sentent la distribution conditionnelle de probabilités sur l’espace 
Z pour un Ÿ donné et satisfont aux relations 


po(>0 rot=1. (9-22) 


La réunion de trois éléments — espace des issues de l'expérience 
Z, espace des états de la nature 6 et distribution de probabilités 
Po (2) sur l’espace Z pour un Ÿ € 6 donné — est appelée espace d'é- 
chantillonnage et se note 


3 — (Z, 6, P) (9-23) 


Il est commode de donner l’espace d'’échantillonnage sous forme 
d’un tableau contenant la distribution p4 (z) sur le produit direct 
des ensembles 6 X Z. 


Exemple 9-7. Dans le problème du remplacement de l'équipement, l'expé- 
rience peut consister en essais de contrôle de l'équipement par les moyens de 
l’entreprise. Dans ce cas, le manque d’un personnel hautement qualifié et d’ap- 
pareils de contrôle et de mesure nécessaires fait que les résultats des essais ne 
reflètent qu'approximativement l’état réel de l’équipement. Supposons que 
l'expérience puisse avoir quatre issues possibles: 

:,: l'équipement est en bon état; 

::: la réparation courante est nécessaire ; 
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za: il faut remplacer les pièces usées; 

z,: l'équipement ne peut plus rester en service. 

Les probabilités de chacune de ces issues pour différents états de la nature 
sont données au tableau 9-4 qui représente l’espace d’échantillonnage du problè- 
me en question. L 


Tableau 9-4 Tableau 9-5 
Espace d’échantillonnage dans le Espace d’échantillonnage 
problème du remplacement dans le problème de la 
de l’équipement ligne technologique 
Ô _ 0 - 
21 | 22 29 24 21 | 22 23 
Ÿ, 1/2 1/2 0 0 Ÿ 0,60 | 0,25 | 0,15 
Vo 0 1/2 1/2 (9) 


Exemple 9-8. Dans le problème de la ligne technologique, l'expérience peut 
prendre la forme d’une analyse préalable grossière de la teneur en impuretés 
(l'analyse de précision effectuée en laboratoire est exclue, car elle necessite 
beaucoup de temps pendant lequel l'équipement doit rester en inactivité). Les 
résultats de l’expérience sont les suivants: 

z: il n’y a pas d’impuretés; 

z2: il y a peu d’impuretés; 

za: il y a beaucoup d’impuretés. 

Dans ce cas, l’espace d’échantillonnage peut se présenter comme indiqué 
au tableau 9-5. 


c) Fonction de décision 


Dans un problème sans expérience, le statisticien doit prendre 
une décision appartenant à l’espace des décisions À en'se basant sur 
l'information a priori & (Ô) concernant les états de la nature. Dans un 
problème à expérience, la décision prise par le statisticien est fonction 
de l'issue z € Z de l’expérience. Pour formaliser ce problème, il 
peut analyser à l’avance toutes les issues possibles de l'expérience et 
élaborer une règle d qui détermine quelle décision a € À il faut pren- 
dre pour chacune des issues possibles z € Z de l’expérience. Cette 
règle représentera une application de l’espace des issues Z de l’expé- 
rience sur l’espace des décisions À 


d:Z—A, (9-24) 
ce qui peut encore s’écrire 
d (z) = a. 


La règle d (z), qui détermine la décision a € À que le statisticien 
doit prendre quelle que soit l'issue z € Z de l’expérience, est appelée 
fonction de décision. 
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Expliquons la notion de fonction de décision sur l'exemple sui- 
vant. Supposons que l’espace des décisions comprenne trois éléments 
A — {a,, a:, a,;} et que l’espace des issues de l'expérience inclut 
cinq éléments Z = {2,, Z:, 2», 2x, 25}. La fonction de décision 
d (z;) = a; peut être donnée sous la forme d’un ensemble des couples 
d'indices (i, j) définissant la décision a; pour l'issue z; de l’expérien- 
ce. Une fonction de décision sera, par exemple, représentée par l’en- 
semble {(1, 1), (2,1), (3,2), (4,2), (5,3)} qui signifie que, pour les 
issues z, et z,, on prend la décision a,, pour les issues z, et z,, la dé- 
cision a., et pour l'issue z;:, la décision a.. Certes, la fonction de dé- 
cision citée n’est pas l’unique possible. On pourrait aussi bien consi- 
dérer les fonctions de décision de la forme {(1, 1,), (2,2), (3,2), 
(4, 3), (5, 3)} ou {(1, 3), (2, 1), (3, 2), (4, 3), (5, 2)}, etc. Cornpte tenu de 
ce qui vient d’être dit, il est commode d'introduire l'espace D com- 
portant la totalité des fonctions de décision possibles et de l'appeler 
espace des fonctions de décision. 

La fonction de décision considérée décompose l'ensemble Z 
en sous-ensembles disjoints Sa» notamment 


Sa, = {Z4, 20} Say = {23, Z}; Sa, = {25}. (9-25) 


En utilisant la terminologie de la théorie des ensembles, on peut 
dire que toute fonction de décision d € D peut être considérée com- 
me la décomposition de l'espace des issues de l’expérience Z en sous- 
ensembles disjoints $S, tels que 


Sa = {z:d(z)=a}, a£A. (9-26) 

Si, en particulier, l’espace des décisions À ne comporte que deux 

éléments a, et a. (problème bialternatif), la fonction de décision 

d (z) décompose l’espace Z en l’espace S (appelé domaine critique) 
et en son complémentaire C (S) = S définis par les conditions 
.. si 2CS: 

}= a» si 2EC(S). 


La notion de fonction de décision permet de formuler d’une façon 
plus nette le problème du statisticien. Ce problème consiste à choisir 
dans l’espace des fonctions de décision D une fonction de décision 
d (z) telle qu'il soit possible de prendre la décision la plus avantageu- 
se. Pourtant, pour ce faire, il faut savoir estimer les différentes fonc- 
tions de décision. On y parvient à l'aide de la fonction de risque. 


d (z (9-27) 


d) Fonction de risque 


Si le statisticien a arrêté son choix sur une certaine fonction de 
décision d (z), il a déterminé par là même pour chaque issue de l’ex- 
périence z € Z la décision a — d (z) à laquelle, pour ÿ € 6 donné, 
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[NI 
=1 
(de) 


correspondront les pertes 
L (8, a) = LI, d(z)] — L. (6, d). (9-28) 


Toutefois, pour Ÿ donné. l'issue z de l’expérience sera une variable 
aléatoire déterminée par la distribution de probabilités p4 (z) sur 
l’espace Z. Il s'ensuit donc que, pour z donné, les pertes L, (8, à) 
auront lieu avec la même probabilité ps (z) et représenteront aussi 
une variable aleatoire. 

L'estimation de la fonction de décision d (:) pour un état de la 
nature Ÿ donné exigeant de prendre en considération toutes les is- 
sues possibles de l’expérience, il est néces- 
saire de considérer les pertes moyennes 
déterminees sur tout l'espace des issues 
de l'expérience Z. Ces pertes moyennes 
sont appelées fonction de risque. Elles sont 
notées p (Ÿ, d) et sont déterminées à par- 
tir de la relation 


p(Ô,d)=M;1[L:(Ÿ, d)] = E L:(Ÿ, d) po (2). 
| (9-29) 


A chaque état de la nature 8 E 6 et 
à chaque fonction de décision d € D sera 
associée une valeur bien déterminée des 
pertes moyennes, c.-à-d. de la fonction 
de risque p (Ÿ, d) qui, de cette façon, est 
déterminée sur le produit direct des ensem- 
bles © X D d’une manière absolument 
analogue à la détermination de la fonc- Fig. 9-6. Fonction de risque 
tion de pertes L (Ô, a) sur le produit dans le problème de la ligne 
direct des ensembles © X À dans un jeu technologique 
sans expérience. On arrive ainsi à la con- 
clusion que l’espace des fonctions de décision D et la fonction de 
risque p (Ÿ, d) jouent le même rôle dans un jeu à expérience unique 
que l’espace des décisions À et la fonction de pertes dans un jeu 
sans expérience. D'ici, des méthodes analogues de résolution de ces 
deux problèmes. 

Dans un jeu à expérience unique, le statisticien peut aussi adop- 
ter des stratégies mixtes. À cette fin, il doit posséder un mécanisme 
aléatoire pour définir la distribution de probabilités n (d) sur l’espace 
D. Lors de l'utilisation de la stratégie mixte n (d), la fonction de 
risque, désignée dans ce cas par p (Ÿ, n), s'obtient en prenant la 
moyenne de p (Ÿ, d) suivant toutes les stratégies pures qui font par- 
tie de la stratégie mixte donnée. Ainsi donc, 


p (D, m)= Male (9, d1= ZE p(9. d)n(d) (9-30) 
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ou bien, compte tenu de (9-29), 
(8, m = Ÿ L: (8, d) po (e) n (d). (9-31) 


Il est bien naturel qu’en cherchant sa meilleure stratégie dans 
un jeu à expérience unique, le statisticien ne doit partir que des stra- 
tégies admissibles qui sont déterminées d’une façon absolument ana- 
logue au cas d’un jeu sans expérience. 


Eremple 9-9. Déterminons la fonction de risque dans le problème de la ligne 
technologique. Pour rendre les calculs plus commodes, portons dans un même 
tableau 9-6 les pertes du statisticien L (9, a) ct les probabilités des issues de 
l'expérience p,4 (:) données respectivement par les tableaux 9-2 et 9-5. 


Tableau 9-6 


Pertes et probabilités des issues de l’expérience dans le problème 
de la ligne technologique 


a P9 (:) 
Li 
as | a2 | ag 21 | 29 | 23 
Ÿ: 0 | 3 0,60 0,25 0,15 
Vo 5 3 2 0,20 0,30 0,50 
Tableau 9-7 


Valeurs de la fonction de risque p (Ô, «) dans le problème 
de la ligne technologique 


d113 d121 di22 d;23 


d112 


di11 


0,15 
4,00 
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L'espace des issues de l'expérience comportant trois éléments, la fonction 
de décision sera de la forme d (=) — (a;, a, ax) — d;jx, où a;, a; et a sont les 
décisions que le statisticien doit prendre respectivement pour les issues de 
l'expérience :,, za et z:. Ainsi, la fonction de décision d,., signifie que pour les 
issues Z, Za et z4 de l’expérience, le statisticien prend les décisions a;, a, as 

Les valeurs de la fonction de risque calculées d’après les formules (9-29) 
pour chaque fonction de décision sont données au tableau 9-7 et sur la figure 9-6. 
Examinons la façon dont on a obtenu les données de ce tableau en refaisant les 
calculs relatifs à p (Ÿ, d,..). Conformément à (9-29), on a: 

P (9, dise) = L., (9, dise) Pa (21) + L.. (Ô, dico) pg (2) + 
+ L,, (0, dise) Pg (23) = L (9, as) pg (1) + L (8, ao) pp (22) + L (Ÿ, Ge) ps (cs). 
En supposant Ÿ = Ÿ, et Ô = Ô., on obtient: 
P (01, dis) = 0,4; p (02, dos) = 3,4. 


e) Principes de choix de la stratégie 
dans les jeux à expérience unique 


Vu que l'introduction de la fonction de risque ramène un jeu 
à expérience unique à une forme analogue à un jeu sans expérience 
tous les principes de choix de la stratégie dans un jeu sans expérience 
restent valables à une seule différence près qu’au lieu de minimiser 
les pertes moyennes, le statisticien doit maintenant minimiser le ris- 
que moyen. 

Le principe du minimax consiste à choisir la stratégie n (d) pour 
laquelle le risque moyen p (Ÿ, n) soit minimal dans le cas où l'état 
de la nature est le plus défavorable pour le statisticien. Cela signifie 
que la stratégie minimax n* est choisie en partant de la condition 


p(Ÿ, n*)= min max (9, n). (9-32) 
n 


Si en déterminant le risque moyen p (5, n) on prend en considé- 
ration les pertes supplémentaires L’ (Ÿ, a) au lieu des pertes totales, 
la formule (9-32) déterminera le principe du minimax des pertes 
supplémentaires. 

Pour utiliser le principe de Bayes, introduisons la notion de 
risque espéré qui signifie le risque moyen compte tenu de tous les 
états possibles de la nature © € © et de la distribution a priori de 
probabilités sur l’espace 6. Etant donné que, lors de l’utilisation 
du principe de Bayes, le statisticien peut se limiter à l’adoption 
exclusive des stratégies pures, le risque espéré sera 


p (E, d)= > p(Ÿ, d) ë (0). (9-33) 


Le principe de Bayes exige l’utilisation d’une fonction de déci- 
sion d* telle que le risque espéré, appelé dans ce cas risque de Bayes, 


soit minimal: 
p° (&) = p (E, d°) = min P (E, d). (9-34) 
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Exemple 9-10. Déterminons la stratégie minimax et la stratégie de Bayes 
dans le problème de la ligne technologique à expérience unique. Sur la figu- 
re 9-6 ce problème est représenté sous la forme d’un S-jeu. La construction géo- 
métrique permet de voir sans difficulté que la stratégie minimax est définie par 
le point $, de coordonnées (30/14, 30/14) et correspond à l’adoption des stra- 
tégies pures desa et dasa aVec les probabilités 10/14 et 4/14. La stratégie de Bayes 
sera la stratégie djo3- 
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a) Détermination du nombre de stratégies 
dans les jeux avec expérience 


Les exemples des paragraphes précédents montrent que les expé- 
riences faites dans les jeux statistiques entraînent une augmentation 
considérable du nombre de stratégies pures du statisticien. Ainsi, 
dans le cas du problème de la ligne technologique, le nombre de stra- 
tégies pures augmente de 3 à 27 quand on tient compte des résultats de 
l'expérience. Si l’on n’était pas parvenu à représenter ce jeu sous la 
forme d’un S-jeu dans le plan, on se serait heurté à des difficultés 
considérables lors de son analyse. 

Désignons par 4 le nombre total de stratégies pures du statisticien 
dans un jeu à expérience unique. Ce nombre est facile à calculer. Sup- 
posons que dans un jeu sans expérience le statisticien dispose de / 
décisions possibles a,;, . .., a;, tandis que le nombre d'issues possi- 
bles de l'expérience est v. 

Pour v = 1, on a un jeu dont l'issue de l'expérience est connue 
à l’avance, ce qui équivaut à un jeu sans expérience à NV — |. 

Pour v = 2, la stratégie du statisticien peut s’écrire sous la for- 
me d = (a;,, a;), où les quantités a; et ai, peuvent être représen- 
tées par n'importe quels a € À. On peut donc avoir L valeurs diffé- 
rentes de a;, et à chacune de ces valeurs on peut mettre en correspon- 
dance Z valeurs différentes de a;, de sorte que Ÿ = À. 

Pour v = 3, la stratégie du statisticien est d — (a:,, ;,, Gi). 
L'ensemble des solutions a;, et a;, peut prendre À valeurs à chacune 
desquelles on peut faire correspondre ? valeurs de a;, de sorte que 
N =. 

Par un raisonnement analogue on arrive à la conclusion que pour 
L'et v arbitraires, le nombre total de stratégies pures du statisticien 
N = l". Pour des let v grands, le nombre de stratégies pures du sta- 
tisticien peut devenir si important que leur analyse rencontre des 
difficultés majeures. 

Dans ces cas, la recherche des stratégies de Bayes peut être sim- 
plifiée de beaucoup si l’on utilise au lieu de la distribution a priori 
de probabilités la distribution a posteriori calculée sur la base des 
résultats de l’expérience effectuée. Le nombre de stratégies pures 
du statisticien dans le problème avec expérience reste alors le même 
que dans le problème sans expérience. 
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b) Distribution a posteriori de probabilités. 
Formule de Bayes 


La distribution a priori de probabilités & (8) obtenue sur la base 
des données statistiques et de l'expérience passée nous fournit une 
information utile sur la fréquence d'apparition de tel ou tel état de la 
nature, sans aucun rapport aux conditions concrètes dans lesquelles 
le statisticien doit prendre sa décision. Les expériences faites par le 
statisticien ont pour but d'apporter une information supplémentaire 
sur l’état réel de la nature. 

Supposons que l’espace des issues de l’expérience soit donné par 
l'ensemble Z — {z,, ..., z,}. Avec cela, l'issue d’une expérience 
concrète est aléatoire et ne donne pas la possibilité de tirer des con- 
clusions précises sur l’état réel de la nature. Toutefois, l’indétermina- 
tion concernant l’état de la nature diminue sensiblement si l’expé- 
rience est correctement faite. 

Cette variation de l’indétermination concernant l’état de la na- 
ture consiste dans le fait qu'à la suite de l'expérience on obtient à la 
place de la distribution a priori E (0) une nouvelle distribution de 
probabilités £. (Ÿ) qui est appelée distribution a posteriori de probabi- 
lités sur l’espace © pour une issue concrète donnée z € Z de l’expé- 
rience. Voyons maintenant les methodes de calcul de la distribution 
a posteriori de probabilites. 

Remarquons tout d'abord que l'issue de l'expérience, dont le 
but consiste à préciser l’état réel de la nature, sera fonction de l’état 
de la nature Ô. L'étude préalable des conditions dans lesquelles est 
feite l’expérience permet d'indiquer pour chaque état de la nature Ÿ 
la distribution de prohabilités sur l’espace des issues Z de l’expérien- 
ce, qui, de ce fait. représente la distribution conditionnelle de pro- 
babilités p (z | Ÿ) — po(z). 

Pour décrire entièrement une expérience concrète, il faut savoir 
l'issue z € Z de l'expérience et l’état de la nature Ÿ € 6 pour lequel 
l’expériense donnée a été faite. Ainsi donc, le résultat d’une expé- 
rience concrète peut être représenté comme un couple ordonné (z, à) 
qui est un élément du produit direct des ensembles Z X 6. 

Désignons par q (z, Ÿ) la distribution de probabilités sur l’ensem- 
ble ZX. Dans le cas général, cette distribution de probabilités 
variera avec la variation de la distribution a priori de probabilités 
E (d), c.-à-d. sera fonction de &. Pour une distribution a priori con- 
crète E(Ÿ), désignons la distribution de probabilités sur l’ensemble 
Z'X9 par g: (z, Ÿ). 

Il nous faut maintenant lier entre elles les distributions Ë (Ô), 
pe (2). £: (8) et g: (z, Ÿ). Un problème de ce type s’est déjà présenté 
lors de l'examen des variables aléatoires à deux dimensions quand 
l'issue de l’expérience z était le couple ordonné (x, y). 
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Pour ces variables aléatoires, on a eu la relation (5-37) qui, appli- 
quée à notre cas, peut s’écrire 


gz (2, Ÿ) = Po (z) E (8) = Ë: (8) p (2). (9-35) 
D'ici on trouve: 
Py (2) 5 (0) 


O= 


(9-36) 
Dans cette expression, p (2) représente la probabilité incondition- 
nelle de l'issue donnée z de l’expérience, c.-à-d. la probabilité pour 
que l'issue z ait lieu pour un état arbitraire de la nature. Compte 
tenu de ce fait, la probabilité p (z) peut être mise sous la forme 


p (2)= p(z| 8 U 8e ... Un). (9-37) 


En appliquant à cette expression la formule de la probabilité 
totale (5-42), on obtient: 


p(z)= à Pe (2) E(Ÿ). (9-38) 


En prenant en considération (9-38), la formule de la distribution 
a posteriori de probabilités E, (8) prend la forme 


Po (2) & (0) 

E, (0) = 9-39 
: (0) N pe (EE (0) (7-39) 
Ÿ 

Dans la théorie des probabilités, cette formule est appelée for- 
mule de Bayes. 


Exemple 9-11. Déterminons la distribution a posteriori de probabilités 
dans le problème de la ligne technologique. Les calculs effectués à l’aide de la 
formule (9-39) sont résumés au tableau 9-8. 


Tableau 9-8 


Calcul de la distribution a posteriori de probabilités dans le problème 
de la ligne technologique 


Pp () Pp (2) & (6) 5: (0) 
° & (0) 
zt | 2° | 23 21 | 22 29 21 | 22 29 
l 
6, | 0,6 |0,60 | 0,25 | 0,15 | 0,36 | 0,15 | 0,09 lo,81810,555 | 0,310 
% | 0,4 |0,20 | 0,30 | 0,50 | 0,08 | 0,12 | 0,20 [0,182 0,445 | 0,690 
D pe (2) & (0) 0,44 | 0,27 | 0,29 
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Le calcul est effectué en partant de la distribution a priori de probabilités 
& (6) donnée au tableau 9-2 et de la distribution conditionnelle de probabilités 
Pe (z) prise du tableau 9-5. 

Les valeurs des probabilités a posteriori trouvées montrent que, pour l'is- 
sue =, ou z: de l'expérience, l'indétermination relative aux états de la nature 
diminue considérablement. Mais pour l'issue :, de l'expérience, l’indétermina- 
tion augmente par rapport à ce qu’elle était avant l'expérience. 


c) Principe du maximum de vraisemblance 


La connaissance des probabilités a posteriori permet d'estimer 
l'état de la nature en utilisant le principe du maximum de vraisem- 
blance. Conformément à ce principe, on prend comme estimation de 


l'état de la nature Ÿ l’état de la nature qui semble être le plus pro- 
bable en vertu des données expérimentales. 


Exemple 9-12. Etablissons l'estimation de l'état de la nature Ÿ dans le 
problème de la ligne technologique pour l'issue z, de l'expérience. Conformément 
au tableau 9-8, les probabilités a posteriori des états de la nature 6, et Ÿ., pour 
l'issue z, de l'expérience sont les suivantes: 


Ez1 (01)=0,818; E,, (02) — 0,182. 


Etant donné que max [Ë, (0), &, (9:)] = &, (01), d'après le principe de la 


vraisemblance maximale, on a Ÿ — 8. 

Le principe du maximum de vraisemblance est souvent utilisé pour choisir 
la décision dans un problème bialternatif. Dans ce problème, l’espace des états 
de la nature comporte deux éléments 6 — {Ÿ,, d,} avec la distribution a priori 
de probabilités E (9) — (6, 1 — &). L'espace des décisions du statisticien com- 
prend également deux élements À = {a,, a,}, où a, est la décision que l’état 
de la nature est 04; a la décision que l'etat de la nature est Ÿ,. On connaît 
également les distributions conditionnelles de probabilités des issues de 
l'expérience p4 (:) pour à = Ÿ, et pour Ü —0,. Prendre la décision a € (ai, &:} 
d'après Les résultats de l'issue z € Z de l’expérience. 

Exemple 9-13. Problème du radar. Sur l'écran d’un radar un écho peut appa- 
raître soit à la suite de la présence d’un objectif dans la zone de détection, soit 
par suite de l’action de différents parasites. Il s'ensuit donc que l’on peut se 
trouver en présence de deux états de la nature: Ÿ, qui correspond à la présence 
de l'objectif, et 8, lorsque l’objectif est absent. En observant l'écran, on peut 
prendre deux décisions : a, qui suppose la présence de l'objectif, et a, qui affirme 
son absence. Lorsqu'on agit de cette façon, on peut commettre des erreurs de 
deux genres: 

ai | Ÿ.: erreur de premier genre appelée parfois « fausse alerte » ; 

aa | Ÿ,: erreur de deuxième genre appelée parfois « manque d'objectif ». 

Pour prendre la décision dans un Droblème bialternatif, on utilise souvent 
le rapport de vraisemblance défini par la relation 


__ Ez (01) 
AE GS" 


On dit que l’on effectue la vérification suivant le rapport de vraisemblance 
si un nombre k est donné de façon que la décision soit prise en conformité 
de la règle suivante: 

on prend la décision a; si A(z) > k; 

on prend la décision a, si A(z) <k; 

on prend la décision a, ou a: si A (:) = k. 


(9-40) 
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La valeur de k est choisie en fonction des conséquences que peut avoir une 
décision erronée. Ainsi, dans le problème du poste radar, l'erreur du type 
« fausse alerte » peut avoir des conséquences beaucoup plus sérieuses que l’er- 
reur du type « manque d'objectif ». La décision a, doit être prise seulement si 
L’on a la certitude que l'objectif existe réellement, c.-à-d. si la condition &. (0,) > 
DE. (02) est satisfaite. Cela signifie que, dans ce cas, il faut prendre & © 1. 


d) Détermination de la décision de Bayes 
par l’utilisation des probabilités a posteriori 


Au début du présent chapitre, on a vu que la difficulté princi- 
pale rencontrée lors de la résolution d’un problème avec expérience 
consistait dans l'augmentation brusque du nombre de stratégies 
avec l’augmentation du nombre d'’issues possibles de l'expérience. 
Mais en réalité, il n’est pas du tout nécessaire de prendre en consi- 
dération toutes les issues possibles de l'expérience. Si l'expérience 
aboutit à une certaine issue concrète 5 € Z, le problème doit étre 
résolu justement pour cette issue. 

On peut le faire en calculant, pour l'issue donnée z de l’expérien- 
ce, la distribution a posteriori de probabilités E, (Ÿ) sur l’espace des 
états de la nature ©. Dans ce cas, on connaît l’espace des états de la 
nature 6, l’espace des décisions À et la distribution de probabilités 
sur l’espace des états de la nature E. (ô) compte tenu du résultat de 
l'expérience. Mais ce problème diffère du problème sans expérience 
seulement par l’utilisation de la distribution a posteriori de proba- 
bilités £. (0) au lieu de la distribution a priori & (Ÿ). Donc, les métho- 
des de résolution de ce problème sont aussi analogues à celles adop- 
tées dans le problème sans expérience. 

Lors de l’utilisation des probabilités a posteriori £. (ÿ) on prend 
en qualité de stratégies pures du statisticien les éléments de l’espace 
des décisions À — {a,, ..., a;}. Dans ce cas, chaque action a € À 
sera accompagnée des pertes du statisticien Z (E., a) déterminées, 
par analogie à (9-2), comme suit: 


L(E, a) = Moi: 12 (, a)] = D L(Ÿ, a)£:(Ô), (9-41) 
ou bien, compte tenu de (9-39), 
> L (9, a) py (2) E (M) 
2 P (2) (0) 


Le principe de Bayes consiste à choisir une action a* € À telle 
que les pertes définies d’après (9-42) soient minimales : 


R°(E)=R(E:, a°)=minL(E, a). (9-43) 
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e) Problème bialternatif 


Tilustrons les principes exposés en résolvant un problème bial- 
ternatif à distribution a priori de probabilités & (9) — (&, 1 — £). 
Si les décisions sont correctes les pertes seront considérées comme nul- 
les. L'erreur du premier genre 


(a; | 1) entraîne les pertes w, tandis Tableau 3-9 

que l'erreur du deuxième genre Pertes dans un problème 

(a, |0,) donne comme pertes 1. Dans bialternatif 

ce cas, la matrice de paiement prend 1 1 

la forme du tableau 9-9. ô | ai | az 
Examinons la fonction de déci- 

sion d(z) qui, conformément à | 

(9-27), décompose l’espace des d: * 6 


issues Z de l'expérience en les 2 
domaines $ et C'(S) tels que l’on 

prenne la décision a, si zES, et 

la décision a, si z € C (S). Etant donné que S et C'(S) doivent ètre 
compacts, la résolution du problème se réduit à la recherche de la 
frontière qui décompose l’ensemble Z en sous-ensembles disjoints S 
et C (S). Désignons par z, les éléments z € Z qui constituent cette 


ÿ 


N 


Cor z 
Fig. 9-7. Décomposition de l’espace des issues de l'expérience dans un problème 
bialternatil 


frontière. Sur la figure 9-7 sont montrées les frontières z, pour les 
cas unidimensionnel et bidimensionnel. 

Pour trouver l'équation qui définit la frontière z,, écrivons les 
expressions des pertes moyennes pour z donné et pour les décisions 
a, et a. Compte tenu de (9-42) ct des données du tableau 9-9, on ob- 
tient : 

Pn () (1 — 0) 


LE ay=-2PUS , 9-44 

G, a) N pe (2) E () C4) 
Ÿ 

L(E., a) = PUS (9-45) 


CEE 
Ÿ 


La frontière z, correspond à l'égalité des pertes moyennes pour 
les décisions a, a a,, ce qui donne: 


(1 —È) pe: (20) = 2 po: (20) (9-46) 
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Po2 (0) _ ww 
Po, Go) = TE = c(&, w). (9-47) 


On voit qu’à chaque valeur de à va correspondre sa frontière 
z, et par conséquent les domaines correspondants S- et C (S-). En 
même temps, la grandeur & va définir également les probabilités 
des décisions erronées «& (£) et B (£) qui représentent, pour Ÿ = Ü:, 
les probabilités pour que le point z tombe dans le domaine C (S:) 
et que soit prise la décision &, et, pour Ÿ = ., la probabilité pour 
que le point z tombe dans le domaine S: et que soit prise la décision a,. 
Ces probabilités sont définies par les relations 


œ(£)=P(a&l|0:)= À Po,(); (9-48) 
zEC(S) 
B (6) = P (a] 02) — 2 Pos (2) (9-49) 


Pour voir de quelle façon les probabilités de décisions erronées 
dépendent de Ë, trouvons les valeurs de «& (£) et de B (£) pour les va- 
leurs extrêmes & = 0 et Ü = 1. 

Les éléments z € Z compris dans l’ensemble $ sont définis par la 
condition 

L (Ez. di) <L (£2 Q2) 
ou 
Pp> (2) CL 
Pe, () Si 


(9-50) 


Pour & = 0, cette condition donne: 


ce qui est possible seulement si S. = @, C (S:) — Z. Dans ce cas, 
(9-48) et (9-49) donnent «& (0) — 1, B (0) = 0. 
Pour ë = 1, la condition (9-50) donne: 


P@2 (2) 


P6: (2) < % 


ce qui définit le domaine S- = Z, C (S-) = , de sorte que «& (1) — 
= 0, B (1) = 1. 

Ainsi, lorsque & varie de 0 à 1, & (Ë) varie de 1 à 0 et B (&) varie 
de 0 à 1. 

Pour déterminer les pertes moyennes pour toutes les valeurs pos- 
sibles de &, trouvons le risque de Bayes p* (£) pour la fonction de 
décision d (z) considérée. En utilisant l'expression (9-29) pour la 
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fonction de décision p (Ÿ, d) et en prenant la moyenne de cette fonc- 
tion suivant tous les états de la nature, on trouve: 


p* (©) = Gwa (©) + (1 — ©) B (0). (9-51) 


Le graphique de la dépendance p* (£), construit d’après cette for- 
mule compte tenu du caractère trouvé de la variation de « (&) et de 
B (£), est donné sur la figure 9-8. Ce graphique montre que p* (£) 
s’annule pour & — 0 et pour & = 1, et atteint son maximum pour une 


y €) 
sp L 
yep ie, Co) = p°'(Eo) 


0 & Go ! 


Fig. 9-6. Courbe du risque de Bayes dans un problème bialternatif 


certaine valeur & = &,. La valeur £, définit la stratégie de la nature 
la plus défavorable pour le statisticien qui, en adoptant le principe de 
Bayes, subit les pertes p* (6). 

Pratiquement, on rencontre très souvent des cas où les données 
statistiques préalables ne suffisent pas pour déterminer avec préci- 
sion la probabilité a priori 6. C’est pourquoi il est intéressant de trou- 
ver la valeur du risque de Bayes pour le cas où le statisticien prend 
comme point de départ une certaine valeur de la probabilité a priori 
&’ et détermine par suite les grandeurs S?:, & (&') et B (£’), tandis 
que la valeur réelle de £ sera toute autre. Dans ce cas, le risque de 
Bayes est défini par l'expression 


p(, ©) = Ewa (5) + (1 — CE) B (£”), (9-52) 


qui est linéaire par rapport à & et définit la tangente à la courbe y — 
— p* (£) au point & — L’. La figure 9-8 montre que les pertes défi- 
nies par la fonction p (&, £”) seront supérieures à celles définies par 
la fonction p* (&) si & + L’, de sorte qu’une connaissance approxi- 
mative de la distribution a priori de probabilités entraîne une aug- 
mentation des pertes. Bien plus, si & diffère sensiblement de t”, 
les pertes définies par la fonction p (&, L’) peuvent dépasser la valeur 
de p* (&,) correspondant aux pertes de Bayes maximales. Toutefois, 
si l’on part de la distribution de probabilités la plus défavorable cor- 
respondant à &o, la fonction y = p (&, Lo) sera constante et elle dé- 
finira, pour tout €, des pertes égales à p* (&,). Ce cas correspond 
à l'adoption de la stratégie minimax. 


19—6732 
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De cette façon, l’utilisation du principe de Bayes n’est rationnel- 
le que dans les cas où la distribution a priori de probabilités E (#) 
est connue avec une précision suffisante. Mais si la distribution a prio- 
ri de probabilités & (8) n’est pas connue ou bien n’est connue qu’ap- 
proximativement, l’utilisation du principe du minimax peut s’avé- 
rer plus avantageuse. 


9-5. JEUX STATISTIQUES 
À ÉCHANTILLONNAGES SÉQUENTIELS 


a) Remarques préliminaires 


Lors de l’examen des jeux statistiques à expérience unique, il 
a été noté que cette expérience peut être constituée par une séquence 
d'épreuves dont le volume et l’ordre doivent être déterminés à l’a- 
vance. De cette façon, si l’on établit à l'avance que la décision sera 
prise à la suite de V épreuves consécutives, toute cette séquence 
d'épreuves est considérée comme une expérience unique dont l'issue 
sera la grandeur multidimensionnelle z — (z, ..., zx), où 2; 
(i = 1, ..., N) est l'issue de l’i-ième épreuve. Pour cette raison, 
le jeu à expérience unique est souvent appelé jeu à volume d'échan- 
tillonnage donné, en entendant par le volume d'échantillonnage le 
nombre d'épreuves consécutives effectuées. 

Dans les jeux à volume d’échantillonnage donné, le statisticien 
ne peut utiliser que les stratégies qui déterminent le caractère de 
ses actions après l'achèvement complet de toute la séquence d'épreu- 
ves. Toutefois, le statisticien peut agir d’une autre façon. Ainsi, au 
lieu d'effectuer toutes les N épreuves à la fin de chaque épreuve il 
peut décider d’arrêter l’expérience et de prendre une décision conte- 
nue dans l’ensemble À sur la base de l'information qu'il possède 
déjà, ou bien il peut décider de procéder à l'épreuve suivante. Cela 
élargit la classe de stratégies possibles du statisticien, car au choix 
de la décision contenue dans l’ensemble À s’ajoute le choix de la 
décision d'arrêter ou de continuer l'expérience. Ces jeux sont appelés 
jeux à échantillonnage séquentiel. Avec cela, si l'on fixe le nombre li- 
mite admissible d'épreuves à la suite desquelles une décision compri- 
se dans l’ensemble À doit obligatoirement être prise, on est en pré- 
sence d’un jeu à échantillonnage séquentiel tronqué. Dans la suite, nous 
nous bornerons aux jeux de ce genre en renvoyant le lecteur qui s’in- 
téresse à l’étude plus détaillée de ce problème aux ouvrages spéciali- 
sés [54, 59. 60]. Les résultats isolés successifs de l'expérience seront 
nommés observations. 

Si l'expérience n’entraînait pas de frais, l'élargissement de la 
classe de stratégies par l'introduction des échantillonnages séquen- 
tiels ne serait pas privé de sens, car le statisticien ne pourrait que 
gagner en obtenant toutes les N observations. Pourtant, dans beau- 
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coup de cas, l’expérience coûte cher et nécessite du temps pour être 
faite. Dans ces conditions, le statisticien peut obtenir un gain impor- 
tant si à chaque stade de l'expérience il compare le coût de la conti- 
nuation de l'expérience avec le gain espéré déterminé par l’informa- 
tion supplémentaire obtenue. 

Voyons maintenant comment peut-on decrire un jeu à échantil- 
lonnage séquentiel tronqué. Désignons par Z; l’ensemble des issues 
de l’i-ième épreuve. Alors, l’espace entier des issues Z de l’expérien- 
ce obtenues après l’exécution de toutes les N épreuves peut s’écrire 


Z=2Z X ... X Z y. (9-53) 


Dans un jeu à échantillonnage séquentiel, nous admettons que 
la décision puisse être prise non pas sur la base de toutes les N obser- 
vations Z, - .., 2x, mais en obtenant seulement les j premières 
observations Z,, ..., z De cette façon, l’ensemble Z peut être 
décomposé en les sous-ensembles disjoints S,, 91, ..., SN tels 
que, si z € S;, la décision soit prise sur la base des j premières obser- 
vations. 

L'ensemble S — (S,, S,, ..., Sy) est appelé plan de l'échan- 
tillonnage séquentiel. L'ensemble Z peut être décomposé en les sous- 
ensembles disjoints S,; par plusieurs procédés différents. Chacun de 
ces procédés va déterminer son plan de l’échantillonnage séquentiel. 
Désignons par C l’ensemble des plans possibles de l’échantillonnage 
séquentiel et appelons-le classe complète d'échantillonnages séquentiels. 

Pour avoir la possibilité de prendre une décision, il faut définir 
la fonction de décision d (z) qui définit pour chaque séquence 
d'observations la décision de l’ensemble À. Tout comme dans le cas 
d'un jeu à expérience unique, le statisticien choisit la fonction de 
décision d (z) dans l’espace des fonctions de décision D qui contient 
toutes les fonctions de décision possibles. 

Dans un jeu à échantillonnages séquentiels, la stratégie du sta- 
tisticien consiste tout d’abord à choisir le plan de l’échantillonnage 
séquentiel S$ € & qui indique le moment où doit prendre fin l’ex- 
périence, ensuite, à choisir la fonction de décision d € D qui déter- 
mine la décision à prendre à la fin de l'expérience. Ainsi, le couple 
(S, d) définit la stratégie du statisticien. Compte tenu du fait que 
le couple (S, d) est un élément du produit direct 6 X D, on en 
conclut que 6 X D est l’espace des stratégies pures du statisticien. 

Le nombre total de stratégies dans les jeux à échantillonnages 
séquentiels est beaucoup plus important que dans les jeux à expé- 
rience unique, ce qui rend difficile l'élaboration de la liste com- 
plète des stratégies du statisticien et le choix de la meilleure d’en- 
tre elles. Ce travail peut être sensiblement simplifié en calculant 
à chaque stade de l'expérience la distribution a posteriori de proba- 
bilités sur la base de toute l'information accumulée à ce moment. 
Au fur et à mesure de l'obtention des observations consécutives 
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l'indétermination relative à l’état réel de la nature diminue et l’oc- 
casion se présente d'élaborer les critères de détermination du moment 
où l'expérience doit être achevée pour prendre une décision de l’en- 
semble À. 


b) Utilisation de la distribution a posteriori de probabilités 
pour la détermination des règles de Bayes séquentielles 


Nous n’allons considérer que des jeux statistiques dont les résul- 
tats des épreuves isolées z,, . .., zN sont des variables aléatoires 
indépendantes. Désignons par go (z;) la distribution de probabilités 
sur l’espace Z; pour un état de la nature donné Ÿ. Le coût d’une 
épreuve isolée sera considéré constant € = 1. 

Pour décrire le plan des échantillonnages séquentiels, prenons 
en qualité de base la distribution de probabilités E (Ÿ) sur l’espace des 
états de la nature ©, en entendant par la distribution E (8) non seule- 
ment la distribution a priori de probabilités précédant l'expérience. 
mais aussi la distribution a posteriori de probabilités après l’accom- 
plissement d’un certain nombre d'épreuves. Dans ce qui suit, on va 
désigner par &o (0) la distribution a priori de probabilités, et par 
Ey (0) la distribution a posteriori de probabilités après j épreuves. 

La distribution de probabilités E; (0) comprendra toute l'infor- 
mation concernant l’état de la nature Ÿ aussi bien celle qui précé- 
dait l'expérience, que celle obtenue à la suite des j premières obser- 
vations. Pour cette raison, la distribution £;(Ô) peut être considérée 
comme étant la distribution a priori précédant la (j + 1)-ième ob- 
servation. Il s'ensuit que la distribution E;4, (d) est exprimée en 
fonction de E; (8) à l’aide de la formule pour la distribution a poste- 
riori de probabilités. Considérons le passage de la distribution a prio- 
ri de probabilités E; (8) à la distribution a posteriori E;4, (Ÿ) comme 
une certaine transformation 7 de la distribution E&; (8). Alors, la 
distribution a posteriori de probabilités peut s'écrire en vertu de 
(9-39) de la façon suivante: 


_ 8 (9) ga (2j+1) 
TE (9) = Era (9) = 


ne ——— ©. 9-54 
DE (0) go (siæ1) 059 
ô 

Examinons le principe d'obtention du plan de l’échantillonnage 
séquentiel sur la base de l'utilisation de la distribution a posteriori 
de probabilités en prenant comme exemple un problème bialternatif, 
où O — {0,, 0.} et À — {a, a} 

Désignons par (&, 1 — &) la distribution a posteriori de probabi- 
lités sur l’espace © après un certain nombre d'épreuves. Dans ce pro- 
blème, l’espace E des stratégies mixtes de la nature est défini par le 
domaine des valeurs possibles de &, c.-à-d. par l'intervalle [0, 1] de 
l'axe réel. 
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Il se peut que Ë — 1. Dans ce cas, on ne peut prendre que la dé- 
cision a,. Si & — 0, la décision a, est obligatoire. Mais si, par exemple, 
& — 0,5, aucune des décisions n’a la priorité et l'expérience doit 
être continuée pour préciser l'état réel de la nature. 

Ici, on a examiné les cas extrêmes de la distribution de probabi- 
lités £ (86). Dans le cas général, on peut se donner les quantités 6 et 
y OLÔL1,0LY<L1, Ô > y) telles que: 

si 6 se trouve dans la gamme (6, 1], on prend la décision a,; 

si 6 se trouve dans la gamme (0, y}, on prend la décision a:; 

si & se trouve dans la gamme (y, 6), on prend la décision d’effec- 
tuer l'épreuve suivante. Les gammes A (a,) — [6, 1] et A (a) = 
— [0, y] sont appelées do- 


maines d'arrêt. La représen- Décision 
tation graphique de la règle Décision a; Tennér ire Décision ay E 


qui vient d'être formulée 
est donnée sur la figure 9-9. 

Les domaines d'arrêt 
peuvent être également dé- 
terminés pour le cas où le 
nombre d'état de la nature 
est supérieur à deux. Il est vrai que, dans ce cas, l’espace E des 
stratégies mixtes de la nature sera d’une forme plus compliquée. 
Ainsi, pour trois états de la nature, cet espace a la forme d'un 
triangle équilatéral dont la hauteur est égale à l'unité (cf. fig. 9-11). 

En général, on appelle domaine d'arrêt A (a) dans l’espace E 
un sous-ensemble de cet espace 


A(a<E (9-55) 


tel que, si à la suite d’une certaine épreuve on a E (8) € A (a), on arré- 
te l’expérience et l’on prend la décision a. 

Etant donné que chaque épreuve a son coût, il ne sera pas indif- 
férent si E (8) tombe dans le domaine À (a) avant l'expérience ou 
après un certain nombre d'épreuves. Cela signifie que chaque nouvelle 
épreuve fait varier aussi bien la valeur de E (ÿ) que celle de À (a). 
En outre, à chaque stade de l'expérience on ne s'intéresse pas aux 
épreuves déjà effectuées et dont les résultats ont été déjà utilisés, 
mais à celles qui doivent être faites pour parachever l'expérience. 
Conformément à ce qui vient d’être dit, les domaines d'arrêt au stade 
de l'expérience où l'on a effectué j épreuves sur N seront désignés 
par Awy (a). 

Si l’espace des décisions comporte m éléments «a, ..., am, à 
chaque stade de l'expérience il faut déterminer m domaines A (a) 
correspondant à chaque a € À. Ces domaines doivent être convexes 
et disjoints [54]. 


0 A(a) ? Ô Alan 1! 


Fig. 9-9. Règle de la prise de décision dans 
un problème bialternatif 


294 CH. 9. THÉORIE DES DÉCISIONS STATISTIQUES 


c) Règle des échantillonnages séquentiels 


Supposons que dans l'espace E soient délimités m domaines 
À (a) à chaque stade de l'expérience. Dans ce cas, la règle des échan- 
tillonnages séquentiels consistera dans ce qui suit. 

On connaît à l’avance la distribution a priori de probabilités 
Eo (0). Si Eo (9) € Ay (a;) pour un certain i, on prend la décision a, 
sans faire d'expérience. Si &, (0) & Ax (a;) pour aucun i, on exécute 
la première épreuve et l’on calcule la distribution a posteriori de 
probabilités E.(0). Ensuite, on examine les domaines A;_, (a). 
Si E1 (0) € Ar, (a;) pour un certain à, l'expérience est arrêtée et l’on 
prend la décision a;. Si E, () é Ax_ (a;) pour aucun i, on effectue 
l'épreuve suivante et ainsi de suite. 

Généralement parlant, si l'expérience n’a pas été arrêtée après 
les j — 1 premières observations, on effectue une observation sup- 
plémentaire et l’on calcule E;, (8). Si &; () € Ay-, (a;) pour un cer- 
tain i, l'expérience est arrêtée et l’on prend la décision a;. Si la dé- 
cision n’a pas été prise après la (V — 1)-ième observation, on effectue 
la VN-ième observation et l’on fait le choix définitif. Pour satisfaire 
à cette condition, les domaines À, (a;) doivent être choisis de façon 
que 


U Ao(a)=E. (9-56) 


On voit de cette façon que le problème de la description des règles 
séquentielles de Bayes se ramène au problème de la définition des 
domaines A,-; (a) dans l’espace E pour tous les a € À et tous les 
jde0à N. 


d) Fonction de risque pour la règle séquentielle optimale 


En présence d’échantillonnages séquentiels, la fonction de risque 
doit définir à chaque stade de l'expérience (par exemple, apres j 
épreuves) les pertes moyennes minimales que le statisticien va subir 
en prenant la meilleure des décisions possibles, y compris la décision 
concernant la continuation de l'expérience. La prise de décision 
étant basée sur la connaissance de la distribution a posteriori de 
probabilités £; (0), la fonction de risque sera également fonction de 
la même distribution de probabilités. La fonction de risque obtenue 
après j épreuves sera désignée par p* (E;). 

Les expressions de la fonction de risque seront recherchées suc- 
cessivement en partant du dernier stade de l'expérience. Supposons 
que l'on ait effectué toutes les N épreuves et que l’on ait trouve la 
distribution a posteriori de probabilités £, (8). Dans ce cas, les 
pertes moyennes subies par le statisticien qui prend la décision 
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aC À sont égales à 
L'(Ex, a)= 2 L (0, a)Ex (0). (9-57) 


La valeur minimale de ces pertes correspondant à la décision 
de Bayes a* est donnée par l'expression 


R'(Ex)=L(Ex, a*")=minZL(Ex, a). (9-58) 


Etant donné qu'il n’est pas possible de prendre une décision meil- 


leure que a*, la grandeur R* (£;) coïncidera à ce stade de l'expé- 
rience avec la fonction de risque 


p° (Ex) = R* (Ex). (9-59) 


Considérons maintenant un stade arbitraire de l'expérience et 
trouvons les pertes moyennes minimales subies par le statisticien 
après j épreuves (j — 0,1, ..., M — 1). Avec cela, le statisticien 
dispose de la distribution de probabilités E; (8). 

Dans ce cas, le statisticien peut choisir l’une des deux alternatives 
suivantes : 

1. Il arrête l'expérience et prend la décision a € A. Ainsi, les 
pertes moyennes minimales qu'il subit sont 


R*(E)=minL(é;, a)=min  L(d,a)E;(8). (9-60) 
a a Ÿ 


2. [1 peut prendre la décision d'effectuer la (j + 1)-ième épreuve. 
Dans ce cas, il subira des pertes égales à la somme du coût d’une 
épreuve (égal à l'unité) et des pertes après la prise de la meilleure 
décision d'après les résultats de la (j + 1)-ième observation, 
cà-d. p* (Es). 

Mais le statisticien ne connaît pas la distribution de probabilités 
Ej+1 (0). Il ne connaît que la distribution E; (ô) et ne peut déterminer 
Ej+1 (0) que d’après la formule (9-54) en tant que TE; (8), grandeur 
qui peut être trouvée pour des valeurs concrètes de 2,41 € Zj+, et 
Ÿ € © que le statisticien ignore pour le moment. C’est pourquoi il 
ne doit pas avoir en vue une valeur concrète de la fonction de risque 
p* (Ë j+1). mais seulement la valeur moyenne de M [p* (TE;)], la 
médiation devant être réalisée suivant toutes les valeurs possibles 
de 2;+1 € Zj+1 avec la distribution de probabilités go (z;+1) et suivant 
tous les Ÿ € © avec la distribution de probabilités E; (8): 


M {p° (TE;)] = > P° (TE; (0)] ge (2541) 85 (D). (9-61) 
"j+1 


Ainsi, les pertes minimales du statisticien qui décide de conti- 
nuer l'expérience sont : 


1-+ M [p° (TE;)]. (9-62) 
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Après j épreuves, la fonction de risque sera définie par le mini- 
mum des pertes moyennes en examinant les deux façons d'agir du 
statisticien : arrêt ou continuation de l'expérience. Donc, 


p* (8) =min{R°(Ë;), 1+ M [p° (TE;)]}. (9-63) 


L'expression (9-63) peut être présentée sous une forme plus con- 
densée sans utiliser l'indice j désignant le numéro de l’épreuve. Con- 
sidérons le stade de l’expérience où jusqu'à la fin de cette dernière il 
nous reste encore À épreuves. Désignons par & (Ÿ) la distribution a pos- 
teriori de probabilités à ce stade et par £” (0) — T E (8) la distri- 
bution a posteriori de probabilités après avoir effectué encore une 
épreuve. Désignons par p? (£) la fonction de risque au stade où jus- 
qu'à la fin de l'expérience il reste encore k épreuves. Alors les expres- 
sions (9-59) et (9-63) s’écriront : 


ps, (E)= R°(E); (9-64) 
pf (€) = min {R°(#), 1+ M [p-1 (TE)}}. (9-65) 


Désignons par V l’espace des issues de l’épreuve suivante dont 
les éléments seront notés v. En ces notations, on aura: 


R° (E)= min 2 L(9, a)E (0); (9-66) 
M [pà-1(TE)] =) P-1 [TE (8)] ge (v) E (8): (9-67) 


ë (0) ge (v) 
9) = "0", 9-68 
TE (©) S 8 (6) 9 () (9-68) 


) 
Les formules (9-64) et (9-65) peuvent être utilisées pour définir 
les domaines d'arrêt. Mais des résultats relativement simples sont 


obtenus seulement pour le problème bialternatif auquel nous allons 
borner notre exposé. 


e) Détermination des domaines d'arrêt 
pour un problème bialternatif 
en présence d’un échantillonnage séquentiel tronqué 


Examinons le cas d’un problème bialternatif où la fonction de 
pertes est définie par la matrice 
O Qt 


Q= Qei 0 


la distribution de probabilités sur l’espace des états de la nature 
étant £ (8) = (&, 1 — &). Désignons par À, (a,) et À, (a) les domai- 
nes d’arrêt correspondant aux décisions a, et a. au moment où jusqu'à 


. (9-69) 
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la fin de l'expérience il reste encore à effectuer 4 observations. Ces 
domaines sont définis par des valeurs & = 6, et & — Vx, Yr < Ôh, 
telles que 


An (as) = (6, LÉ LA], Axa) = (0< EL Yi. (9-70) 


La définition des domaines d'arrêt se réduit à la détermination 
des valeurs de y, et 6, pour # = 0, 1. ..., NV. On y parvient à l’aide 
des expressions obtenues pour la fonction de risque. 

Commençons la détermination des points frontières des domaines 
d'arrêt à partir de # — 0. En exprimant E (0) en fonction de ë, il 
vient de (9-64) et (9-66): 


PS (6) = R*(C)= min [(1—E) g21, Cgiel. (9-71) 


Conformément à (9-56), À, (a,) et A, (a2) doivent être des ensem- 
bles réels disjoints dont la réunion donne le segment fermé 0,1. Il 
s'ensuit que ces domaines doivent être séparés l’un de l’autre par le 
point & = ÿo = Ô, qui est déterminé par la condition 


(1 — C) Qu = Cgre. (9-72) 


La condition (9-72) est la condition d'égalité des pertes moyennes 
minimales lors de la prise des décisions a, et a.. A partir de (9-72) on 
trouve : 


LR oi 7 
Vo = 00 = Gi2+ Qui (9-18) 


Pour # = 0 arbitraire, la fonction de risque est de la forme 
pi ()=min{R* (5), 1+M [pè-1(T0)}}. (9-74) 


Les conditions d'obtention des valeurs frontières de & pour les 
ensembles A; (a,) et A4 (a.) seront des conditions d'égalité des pertes 
moyennes minimales lors de la prise des décisions 4, ou à, et de la 
décision de continuer l'expérience, ce qui s'exprime par la relation 


R°(&)=1+ M [pi "1 (T0)]. (9-75) 


En observant que, pour RÀ* (£) de l'expression (9-71), la grandeur 
691 est une fonction monotonement croissante de & qui s'annule pour 
6 — Ô, tandis que (1 — Ë) g,. est une fonction monotonement dé- 
croissante de 6, qui s’annule pour à = 1, et en substituant à Ë, 
aux points frontières, y: pour le domaine A, (a.) et 6, pour le domai- 
ne À, (a;), on peut mettre la condition (9-75) sous la forme 


Vades = 1 + M (pË 1 (ya); (9-76) 
(1 — Ôx) que = 1 + M [pË-1 (Tôk)]. (9-77) 
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La représentation graphique de ces conditions est donnée sur la 
figure 9-10. 

Les relations obtenues montrent que le problème de définition de 
Yx et 04 ainsi que de la fonction de risque p£ (6) se ramène au calcul 
de la grandeur M [of (T&)]. La formule (9-67) donne l'expression 
générale de cette grandeur pour © arbitraire. Pour un problème bial- 
ternatif, cette expression prend la forme 


M {pë_1 (T6) = & 2 p*-1 (TE) do, (0) + 


+4—0 L pi: lT (1—0)199.() (9-78) 


ou 
: Cao, () è _ 
Te = Cao, ()+(1—2) go. (v) ? (9-79) 
1— à) ge. & 
T(A—t)= (1— 5) 49, (v) (9-80) 


Cap, We) + (1—Ù) 99, (0) 


Pour 4 — 1, la fonction p$ (&) définie par l'expression (9-71) 
est une fonction très simple de £, de sorte que la grandeur M [p5 (T£)] 


yMLpe., (TE)] 


0 Ayld) 4 N° Ù d Ar(@y) 1 


Fig. 9-10. Détermination des domaines d'arrêt dans un problème bialternatif 


peut être déterminée directement à partir de (9-78). Si l'on connaît 
M [o5 (T6)], on peut calculer pi (£), d'après (9-74), donc, détermi- 
ner M [pf (TE)] d’après (9-78), ensuite p5 (£) d'après (9-74), etc. 
Bien que ce procédé de recherche de 0% (£) nécessite des calculs im- 
portants, il limite les opérations plus compliquées à la détermina- 
tion des espérances mathématiques. 


PROBLÈMES AU CHAPITRE 9 


__ 9-1. D'après les données du tableau 9-3, trouver la stratégie basée sur le 
principe du minimax des pertes supplémentaires dans le problème de la ligne 
technologique. 
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9-2. En utilisant la construction géométrique de la figure 9-6, effectuer les 
calculs nécessaires pour la détermination des stratégies minimax et de Bayes 
dans le problème de la ligne technologique à expérience unique. 

9-3. Un signal « transmis par une voie de communication est entaché de 
parasites s distribués suivant la loi normale {V (0, o°) de façon qu’à la réception 
on mesure la grandeur =: = u + s. Le signal u peut prendre deux valeurs: u = 0 
qui veut dire qu’il n’y a pas de signal (Ô,), et u — u, = const qui signifie que 


[1,0,0) 


[0,1,0) (0,0,1) 


Fig. 9-11. Espace des stratégies mixtes de la nature pour le cas où la nature 
peut se trouver dans un des trois états 


le signal est présent (8.). Le seuil du récepteur est z,. Ce récepteur émet la déci- 
sion que le signal u, est transmis si z > z,. Trouver la valeur du seuil :, en utili- 
sant les méthodes de résolution d’un problème bialternatif et en posant & — 
= 0,29 et w = 2. 

9-4. Montrer que, si la nature peut se trouver dans un des trois états 6 — 
— {0,, 0, 0}, toutes les stratégies mixtes possibles du statisticien & (0) — 
— (1, des Ga) forment un espace des stratégies mixtes en forme de triangle dont 
la hauteur est égale à l'unité, comme on le voit sur la figure 9-11. 


CHAPITRE 10 


PROGRAMMATION DYNAMIQUE 


10-1. COMMANDE OPTIMALE 
COMME PROBLÈME VARIATIONNEL 


a) Formulation mathématique 
du problème de commande optimale 


La construction des systèmes de commande automatique moder- 
nes est caractérisée par la tendance d'obtenir des systèmes qui, dans 
un certain sens, soient optimaux. Lorsqu'il s'agit de la commande des 
processus technologiques, cette tendance trouve son expression en 
l'obtention d'une quantité maximale de produits de haute qualité, 
l'utilisation des ressources (en matières premières, énergétiques, etc.) 
restant limitée. Dans les systèmes de commande des navires. des 
avions ou des fusées, on tâche de minimiser le temps nécessaire pour 
que l’objet commandé arrive à un point donné ou soit placé sur la 
trajectoire nécessaire, en limitant en même temps l'angle de braquage 
des gouvernails, la consommation de combustible, etc. Dans les 
systèmes asservis et de stabilisation, l'attention est portée sur l'ob- 
tention du maximum de précision en présence de toute sorte de con- 
traintes imposées aux coordonnées de l’objet à régler, aux organes 
d'exécution et au régulateur. Dans tous les exemples susmentionnés, 
les problèmes de commande se ramènent à la découverte du meilleur 
(dans un certain sens) processus parmi une multitude de processus 
possibles, donc ils se rapportent à la classe de problèmes de commande 
dynamiques. 

Au chapitre 6 on a vu que la formulation des problèmes dynami- 
ques de commande optimale se réduit à ce qui suit. On a un objet 
commandé dont l’état est caractérisé par une variable multidimen- 
sionnelle z — (241), ..., xN)). Le caractère des processus ayant 
lieu dans l’objet commandé peut être changé en mettant en œuvre telle 
ou telle commande «x de l’espace des commandes admissibles U. 
En général, la commande x € U peut aussi être une grandeur multi- 
dimensionnelle u = (uti), . .., u(R)). 

Le caractère de l’évolution de l’objet commandé est décrit par 
un système d'équations différentielles 


z=g(x, u), x(0)=c. (10-1) 


En tant que critère de qualité de la commande, on prend une esti- 
mation intégrale de la forme 
T 


Ji(u) = | Qit(8), u(1 de (10-2) 


0 
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ayant le sens physique de pertes, où T est le temps de déroulement du 
processus de commande et Q,{x(t}), u (t)}] = q, (t) sont les pertes 
instantanées au moment { pour l’état x ({) du système et la comman- 
de u (t). En qualité de contraintes additionnelles on peut avoir des 
contraintes imposées aux ressources ou aux limites de variation de 
certains paramètres et qui s'expriment mathématiquement par la 
relation 


T 
| H{r(t).u(b]d£K. (10-3) 
0 


coïncidant avec (6-33). 

Au chapitre 6 il a été indiqué qu'une commande u de l’ensemble 
des commandes admissibles U est appelée commande optimale lors- 
que, pour l’objet décrit par l’équation différentielle (10-1), en pré- 
sence des contraintes données imposées aux ressources (10-3), le 
critère de qualité de la commande (10-2) atteint sa valeur minima- 
le (maximale). 

Le problème de la commande optimale formulé de cette façon 
se rapporte à la classe de problèmes variationnels dont l'étude fait 
l'objet de la branche des mathématiques appelée calcul variationnel. 
La grandeur J, (u) définie par la relation (10-2) est appelée fonction- 
nelle. A la différence d'une fonction, par exemple f (x), dont les 
valeurs numériques sont définies sur l’ensemble des valeurs de l'ar- 
gument zx, les valeurs numériques de la fonctionnelle J, (u) sont dé- 
finies sur l’ensemble de toutes les commandes possibles uw (4). 
Le problème de recherche de la commande optimale se ramène à choi- 
sir de l’ensemble des commandes admissibles w ({) une commande 
telle que la fonctionnelle J, (u) prenne sa valeur numérique mini- 
male. 

D'habitude, aux problèmes nécessitant la minimisation d’une 
fonctionnelle de la forme (10-2) subordonnée à la relation différentiel- 
le (10-1), en présence de la contrainte intégrale (10-3), on substitue 
la minimisation d'une nouvelle fonctionnelle 


T T 
J{u) = | Qi(x,u)dt+X | H(x, u) dt, (10-4) 
0 0 


subordonnée exclusivement à la relation différentielle (10-1). Le 
paramètre À de la fonctionnelle (10-4), appelé multiplicateur de La- 
grange, joue dans les problèmes de commande optimale le rôle de 
« prix » des ressources limitées. Sa valeur est trouvée à partir des con- 
ditions aux limites du problème variationnel. 

La possibilité de simplifier un problème variationnel à contrain- 
tes intégrales par l'introduction des multiplicateurs de Lagrange est 
basée sur le théorème ci-après. 
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Théorème 10-1. Si u (t) est la commande optimale, pour laquelle la 
fonctionnelle (10-4) atteint son minimum absolu, et si la contrainte 
(10-3) est respectée, alors pour u (t) est atteint le minimum absolu de la 
fonctionnelle (10-2) subordonnée à la contrainte (10-3). 

Démonstration. On utilise la démonstration par l’absur- 
de. Soit v (f) une autre commande différente de u (f) et telle que 


T T 
| Qtzvd< | Qi(x, u)dt (40-5) 
0 0 


et que la condition 


T 
| H(x, v)dt £K (10-6) 
0 

soit satisfaite. Alors, 


Qi(x, v) d'+K < 


On) M] 


T T 
| Q:(z, v)dt+2 | H(z.v)d< 
0 0 


T T T 
< [Q(z.u)d+AK= | Qi(z,u)dt+à | H(x,u)dt, (10-7) 
0 0 0 


ce qui contredit l'hypothèse que w ({) minimise (10-4). 

L'application des procédés du calcul variationnel au problème 
de recherche de la commande optimale ne s’est pas répandue à cause 
de toute une série de complications qui surgissent à cet effet. Pour 
cette raison, nous n'allons pas nous attarder sur les méthodes de réso- 
lution du problème variationnel en priant le lecteur intéressé de 
s'adresser aux ouvrages spécialisés [61]. Pour le moment, on ne re- 
lèvera que certains points nécessaires à l’exposé qui suit. 

Une des plus importantes notions du calcul variationnel est celle 
de variation d'une fonction qui, lors de l’étude des fonctionnelles, joue 
le même rôle que la différentielle lors de l'étude des fonctions. 

Soit f (x) une fonction continue sur l'intervalle [a, b]. Examinons 
un point x intérieur à cet intervalle et une certaine valeur fixée de la 
différentielle de l'argument de la fonction Ax — dr. La différence 


f(x + Az) — f(x) = df (x) = f(x) Az (10-8) 


est appelée différentielle de la fonction f (x) au point zx. On sait que 
la condition df (x) — O0 est une condition nécessaire pour que la 
fonction f (x) atteigne son minimum (maximum) au point z. 

Pour aboutir à une analogie avec le calcul variationnel, il est 
commode de définir la différentielle df (x) d'une façon un peu diffé- 
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rente. Examinons la valeur de la fonction f (x + eAzx). Pour x et 
Az fixés, elle sera fonction de e. En dérivant cette fonction par 
rapport à e& et en posant € — 0, on obtient: 


i(a+er)| = f(x) Az= dj (x). (10-9) 


Examinons maintenant les notions analogues du calcul variation- 
nel. Soient uw (t) et u, (t) deux commandes utilisées. La différence 


Ou (t) = u, (t) — u (1) (10-10) 


est appelée variation de la fonction ,u (f), tandis que la différence 
ôJ (u) = J (u + ôu) — J (u) (10-11) 


est appelée variation de la fonctionnelle. 

La variation de la fonctionnelle peut être définie d'une autre 
façon. A cette fin, examinons, pour w (t) et Ôu (t) fixées, la fonction- 
nelle 


J (u + eôu) — œ(e) (10-12) 


qui est fonction de £&. Supposons que cette fonctionnelle soit définie 
pour différents e, ce qui veut dire que les différentes commandes 
u ({} + eut) sont possibles au voisinage de la commande fixée 
u (t), c.-à-d. u it) est un point intérieur de l’espace des commandes 
admissibles U. Dans ce cas, la variation de la fonctionnelle peut être 
définie par analogie à la différentielle d'une fonction, donnée par 
la relation (10-9), comme 


6J (u)=-2 J (u + eôu) | (10-13) 


Si u (t) est la commande optimale, la fonction q (eg) atteindra 
son minimum pour € — 0. Dans ce cas, 
2q (e) _ 9 _ L 
T dŒ e=0 dE J(u+ eôu) =0 (10 1) 
c.-à-d. ÔJ (u) — 0. Donc, la commande optimale rendra nulle la 
variation de la fonctionnelle. 
Dans le calcul variationnel, la condition ôJ (4) — 0 est utilisée 
pour obtenir l'équation différentielle dite d’Euler dans l’ensemble 


des solutions de laquelle on cherche ensuite la commande x (f) qui 
rend minimale la fonctionnelle (10-4). 
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b) Difficultés liées à la résolution 
du problème variationnel 


Lors de la recherche de la commande optimale à l’aide des pro- 
cédés variationnels, on se heurte à toute une série de difficultés dont 
certaines revêtent un caractère de principe ; 

1) les procédés variationnels permettent de trouver seulement les 
maxima et les minima relatifs de la fonctionnelle J (u), or ce sont 
le maximum et le minimum absolus qui nous intéressent ; 

2) pour beaucoup de problèmes techniques, les équations d’'Euler 
ne sont pas linéaires, ce qui rend souvent impossible l’obtention 
d’une solution explicite du pro- 
blème variationnel ; 

3) d'habitude, les valeurs des 
signaux de commande sont soumises 
aux contraintes qui rendent impos- 
sible la recherche de la commande 
optimale par des procédés variation- 
nels. 

Etant donné que cette dernière 
Fig. 10-1. Forme caractéristique du  Circonstance a eu une importance 

signal de commande optimal décisive pour le développement 
des idées nouvelles dans le domai- 
ne de la commande optimale, examinons-la plus en détail. 

Les contraintes habituelles imposées aux signaux de commande 
sont de la forme 


Fu (CO I< Mi (10-15) 


ce qui signifie que la valeur des signaux appliqués aux organes de 
commande ne doit pas dépasser certaines limites. Ainsi, la tension 
limite appliquée à l’induit d’un moteur électrique, l'angle de braqua- 
ge limite du gouvernail d’un avion, la température limite dans la 
chsmbre de combustion d’un moteur à réaction, etc., ne peuvent 
prendre que des valeurs limitées. Avec cela, l'obtention des proces- 
sus optimaux exige, en règle générale, que les signaux de commande 
soient maintenus à leurs valeurs limites, ce qui correspond au déve- 
loppement le plus rapide et le plus efficace des processus dans l’objet 
commandé. Sur la figure 10-1 est représentée la variation typique, 
pour ces cas, de la commande x ({) pour un processus optimal. 
Pourtant, les valeurs limites de la commande x (t) se situent sur 
les frontières du domaine des commandes admissibles U, donc elles 
ne sont pas des points intérieurs à ce domaine auxquels on pourrait 
appliquer des procédés variationnels. Il est vrai que l’on peut se dé- 
barrasser des contraintes de la forme (10-15) en introduisant des va- 
riables nouvelles v; liées aux variables u, par la relation u; — 
— M; sin v;. Dans ce cas, aux valeurs | u; | — M, vont correspondre les 
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valeurs v, — + x/2 qui sont des points intérieurs au domaine des 
nouvelles commandes admissibles. Mais d'habitude, ce changement 
de variables entraîne une complication considérable des équations 
obtenues. 

Les difficultés auxquelles se heurte la résolution du problème 
de l'optimisation de la commande ont attiré l’attention de beaucoup 
de savants en U.R.S.S. et aux U.S.A. Le mathématicien soviétique 
L. Pontriaguine et ses élèves V. Boltianski, R. Gamkrélidzé et 
E. Michtchenko ont élaboré une théorie de la commande optimale basée 
sur le principe du maximum formulé par L. Pontriaguine. Ce princi- 
pe a permis d'élaborer une base strictement mathématique de la 
théorie de la commande optimale, en ouvrant ainsi de larges perspec- 
tives à son application pratique dans le domaine des systèmes de 
commande automatiques. Etant donné que les cadres du présent livre 
ne nous permettent pas d'exposer la théorie générale de la commande 
optimale basée sur le principe du maximum, nous sommes obligés 
de nous référer à la bibliographie [62 à 64]. 

Le mathématicien américain R. Bellman a trouvé une autre voie 
permettant de calculer les processus optimaux connue sous le nom 
de programmation dynamique [65 à 67]. La méthode de programma- 
tion dynamique fournit à l’ingénieur une procédure efficace de réso- 
lution du problème d'optimisation de la commande, qui se prête 
bien à l’utilisation des calculatrices numériques. Dans ce qui suit, 
cette méthode sera examinée plus en détail. 
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a) Forme discrète du problème variationnel 


Pour surmonter les difficultés rencontrées lors de la résolution 
d’un problème variationnel, on fait appel aux méthodes de calcul 
efficaces comme, par exemple, la méthode de programmation dyna- 
mique. Cette méthode permet de trouver la commande optimale dans 
les problèmes à étapes multiples. Elle peut être aussi appliquée à la 
résolution des problèmes variationnels si ceux-ci sont présentés 
sous forme discrète. 

En utilisant le théorème 10-1, formulons le problème variation- 
nel de la façon suivante: pour l’objet décrit par l'équation diffé- 
rentielle (10-1), trouver, dans le domaine des commandes admissi- 
bles U, la commande w (f) qui minimise la fonctionnelle 


T 
J(u)= | QI: 0), u(9} dt, (10-16) 
0 


Q (x, u) — Q: (x, u) + AH (x, u). (10-17) 


20—0732 
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La forme discrète de ce problème sera obtenue si l’on effectue le 
choix de la commande u (t) seulement aux moments discrets & — 
—= kô, k — 0, 1, ..., nr — 1, où Ô — T/n. Avec cela, au lieu des 
fonctions zx (t) et u (f) nous allons examiner les suites 

Zn = ZT(t)lt=n0, Un =u(t)lt-n0. 

En substituant dans l'équation (10-1) le rapport des accroisse- 
ments (z:4+1 — zx)/Ô à la dérivée x — dx/dt, on obtient à la place de 
l'équation différentielle (10-1) l'équation aux différences finies 


RUE = g(re, Ur). (10-18) 


D'habitude, cette équation s’écrit sous une forme plus commode 
et est résolue par rapport à z:+1: 
The Th + E(Tr, Ux)Ô k—=0,1,...,n—1,zxo—c. (10-19) 
Ainsi, l’intégrale (10-16) sera remplacée par la somme 


n— 1 


Ja(u)= 2 Q(zn, ua) 6, (10-20) 
où l’on entend par la suite de commandes utilisées 
u — (Uo, .... Un-1). (10-21) 
Maintenant, le problème consiste à choisir des commandes u,, 
Ui, - - -» Un_ telles que la somme (10-21) soit minimale. 


Dans beaucoup de problèmes de commande, il est rationnel de 
poser Ôô — 1. En particulier, cela est commode lorsque le processus 
est décomposé d’une façon naturelle en étapes isolées, la commande 
u (t) restant invariable dans les limites de chaque étape. De cette fa- 
çon, on arrive à la commande à étapes multiples, examinée au chapi- 
tre 6, où 7, et u, signifient l’état de l’objet et la commande adoptée 
en début de chaque étape. En adoptant, dans ce cas, la notation 


Th + ETr, Ur) = T'(xx, ux), (10-22) 

on écrira l'équation (10-19) sous la forme 
zh Tan, un); k=0,1,...,n—1; xo=c, (10-23) 
ui coïncide avec l'expression (6-52) définissant la transformation de 


q 
l’état de l’objet au cours d’une étape dans le processus de commande 
à étapes multiples. Pour ô — 1, la somme (10-20) prend la forme 


n—-! 


J, (u) = à Q(x2». ur), (10-24) 


qui coïncide avec l'expression du critère de qualité (6-54) dans le 
processus de commande à étapes multiples. 
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Dans ce qui suit, la méthode de programmation dynamique sera: 
examinée conformément aux relations (10-23) et (10-24), c.-à-d. 
par rapport au processus de commande à étapes multiples. Toutefois, 
la liaison que nous venons d'établir entre les formulations mathé- 
matiques de la forme discrète du problème variationnel et le proces- 
sus de commande à étapes multiples permet également d’étendre les 
résultats obtenus à la résolution des problèmes variationnels. 


b) Relation de récurrence 
de la méthode de programmation dynamique 


L’optimisation de la commande d’un processus à nr étapes consis- 
te à trouver une suite de commandes u,, u1, . .., Un_, telle que Île 
critère de qualité J, (u) atteigne sa valeur minimale. Cette valeur 
minimale du critère de qualité de la commande du processus à nr 
étapes dépendra exclusivement de l’état initial x, et on peut la dé- 
signer par fn (to). Par définition, on a: 


fn (to) = min min ... min{Q(xo, uo) + 
ue ui Un=1 


+ Q (Zi, U) + ... + Q(Zn-1; Un-1)]. (10-25) 


Remarquons que le premier terme de cette expression Q (x, w) 
dépend seulement de la commande #,, tandis que les autres termes 
sont fonctions aussi bien de w, que des commandes adoptées aux au- 
tres étapes. Ainsi, Q (zx,, u.) dépend de u, mais il dépend aussi de w, 
car z, = T (x, uw). Il en est de même des autres termes et c’est pour- 
quoi l’expression (10-25) peut s’écrire 


În (Xo) = min {Q (Zo; Uo) + 
+ min ... Mmin(Q(zis, uy)+... + OQ(zn-1, Un-1)]}. (10-26) 


un-1 
Notons encore que l'expression 
min... min(Q(ri, ui) +... + Q(xn-1, Un-1)] (10-27) 


u! un-—1 
représente la valeur minimale du critère de qualité de la commande 
du processus à #7 — 1 étapes, dont l’état initial est x,. Conformé- 
ment à la définition (10-25), cette grandeur peut être notée f,_, (x). 
De cette façon, on obtient: 


În (To) = min [Q (To, Uo) + fn-1 (x1)]. (10-28) 


Ces raisonnements peuvent être réitérés pour un processus à z — Â 
étapes qui commence par l’état initial z;. Dans ce cas, la valeur mi- 


20* 
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ninrale du critère de qualité de la commande sera 
fn=s (1) = min [Q (us 1) + fn-s (2). (10-29) 


Des raisonnements analogues nous amènent à une expression si- 
milaire pour un Processus à n — - l'étapes, qui commence par l'état x, : 


fn <i\xr) = min nle (a, Ur) + fn-ç+1 (Lixi)]. (19-30) 


L'équation (10-30), appelée souvent équation de Bellman, repré- 
sente une relation de récurrence qui permet de déterminer successi- 
vement la commande optimale à chaque étape du processus com- 
mandé. 

L'idée même de l’ optimisation de la commande à chaque étape 
séparément, s’il est difficile d'optimiser tout d’un coup le processus 
tout entier, n'est pas nouvelle et est souvent utilisée dans la pratique. 
Mais, avec cela, on oublie souvent que l'optimisation de chaque éta- 
pe ne signifie pas l'optimisation du processus tout entier. Ainsi. en 
cédant une pièce aux échecs, on ne peut pas dire que l’on a obtenu un 
avantage au point de vue d’un coup isolé, mais ce sacrifice peut être 
avantageux si l’on considère la partie entière. Les frais d'amortisse- 
ment peuvent paraître désavantageux pour le moment, mais leur 
utilité pour l’entreprise ‘se fait voir à la longue. 
= La particularité de la méthode de programmation dynamique 
consiste dans le fait qu'elle superpose à la simplicité de résolution 
du problème d'optimisation de la commande à une étape isolée 
la perspicacité qui permet de tenir compte des conséquences les: plus 
éloignées que peut entraîner l'étape considérée. 

Lorsqu'on utilise la méthode de programmation dynamique, le 
choix de la commande à une étape isolée ne se fait pas suivant les 
intérêts de cette étape, qui trouvent leur expression dans la minimi- 
sation des pertes justement à cette étape, c.-à-d. de la quantité 
Q (&r, w), mais au point de vue des intérêts du processus tout entier, 
qui s'expriment par la minimisation des pertes totales Q (x;, w:) + 
+ fnt+n) (z;+1) à toutes les étapes suivantes. Il en découle la pro- 
priété fondamentale du processus optimal, qui consiste en ce qui suit : 
quels que soient l'état initial et la commande initiale, les commandes 
suivantes doivent être optimales par rapport à l'état qui représente le ré- 
sultat de l'adoption de la première commande. 

De la propriété fondamentale de la commande optimale il découle 
que |’ optimisation de la commande pour une étape quelconque d’un 
processus à étapes multiples consiste seulement dans le choix des 
commandes suivantes. C’est pourquoi il est commode de prendre en 
considération non pas les étapes déjà passées, mais celles qui restent, 
pour amener le processus à l'état final. A ce point de vue, il est 
commode d'écrire l'équation (10-30) sous une autre forme. 
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Dans l'expression (10-30), la quantité nr — / représente le nombre 
d'étapes qui restent jusqu'à la fin du processus. Désignons cette quan- 
tité par k, et désignons, pour simplifier l'écriture, les quantités 
Li = Tr et y = u,-, par x et u. Elles vont représenter l'état de 
l’objet et la commande utilisée à À étapes à compter de la fin du pro- 
cessus. Désignons par x’ l’état suivant, c.-à-d. l’état auquel passe 
l'objet à partir de l’état x en utilisant la commande u. Cela corres- 
pond à z,-w+1 en notations précédentes. De cette façon, l'équation 
(10-23) s'écrira comme suit 


z' = T (x, u), (10-31) 
et la relation de récurrence (10-30) prendra la forme 


fn (z)= min [Q(z, u)+ fn (x). (10-32) 


c) Calculs liés à la programmation dynamique 


La programmation dynamique est une méthode numérique de 
résolution du problème d’optimisation de la commande, donc elle 
est liée à l'exécution d’un volume important de calculs. Mais cette 
circonstance perd beaucoup de son importance si l’on tient compte du 
fait que les calculs correspondants seront effectués à l’aide des cal- 
culatrices électroniques. 

La détermination de la commande optimale à une étape quelcon- 
que # comptée à partir de la fin du processus est réalisée d’après les 
relations (10-31) et (10-32) qu'il est commode de modifier quelque 
peu pour faciliter les calculs. Désignons par F, (r, u) la valeur du 
critère de qualité de la commande d’un processus à À étapes en présen- 
ce d’une commande optimale aux À — 1 dernières étapes, la comman- 
de à l’étape initiale étant arbitraire. Alors, la relation (10-32) peut 
s’écrire sous la forme 


F,(z,u)=Q(x,u)+fu-1(x); (10-33) 
fn (x) = min F, (x, u), (10-34) 


où x’ est trouvé d’après (10-31). 

Les variables z et u peuvent prendre soit des ensembles finis de 
valeurs, soit des valeurs qui varient de façon continue dans certaines 
gammes. Pour ce dernier cas, rendons discrètes les variables en ques- 
tion en séparant des ensembles finis des valeurs équidistantes dans 
la mesure du possible. 11 s'ensuit que dans les deux cas les variables 
x et u peuvent être considérées comme des éléments des ensembles 
finis X = {21), ..., mm} et U {utt), ..., ut}. Il est commode 
de calculer à l'avance la valeur de Q (x, u) et de la présenter sous la 
forme d’un tableau sur le produit direct des ensembles X X U. 
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Tableau 10-1 
Tableau de calcul de la méthode de programmation dynamique 


x u x’ —T(x,u) Q (x, u) 
1) u(1) T (z0), u(1)) Q (x), u(1)) 
u(r) T (x), u(r)) Q (z0), u(r)) 
22) u(1) T (z®), u(1)) Q (x®), u(1) 
u'7) T (r(7), un) Q (2®), ut") 


x 1h14 (x”) F4 (x, u) {,, (x) us 
20 fuir 0, u OO] Fa (00, ut) 
te fa (#00) ui 
fn it (200 u0)] Fr (1), ut) 
(2) fn-1 [T (29, u(1))] Fh (9), u(1)) 
. . . Îh (9) u? 
frs 17 (7), u0)] Fr (9), ul) 
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Ce tableau doit être gardé dans la mémoire de la calculatrice électro- 
nique. 

Les calculs d’après les formules (10-33) et (10-34) sont effectués 
en remplissant le tableau 10-1. Les deux premières colonnes contien- 
nent toutes les combinaisons possibles de x € X et u € U, les autres 
colonnes étant remplies par voie de calcul des grandeurs respectives. 
Dans les dernières colonnes on inscrit pour chaque x € X la valeur 
minimale de F, (x, u), c.-à-d. on détermine /, (x) et la commande 
optimale u*. 

Des calculs analogues doivent être effectués pour chaque étape 
du processus à étapes multiples en tenant compte du fait que, pour 
la détermination de f (x), il faut avoir le tableau pour f;_, (x), car 
ce dernier permet de trouver les valeurs de f;_, (z”) lorsqu'on remplit 
le tableau 10-1. Il s'ensuit que les valeurs de f;_, (x) doivent être 
calculées avant les valeurs de f, (x). Donc, le calcul des fonctions 
fn (x) doit être commencé à partir de la dernière étape du processus 
à étapes multiples. Si l’on remarque que f, (x) — 0, comme phase 
initiale de calcul il faut prendre #4 — 1 pour laquelle 


Fi(z,u)=Q(z,u), fi(r)=minQ(z, u). (10-35) 


Ensuite, les calculs sont effectués de façon habituelle pour k — 
= 2,3,...,n. 

Après avoir effectué des calculs et rempli les tableaux pour f, (x) 
et u*, pour # — 1, ..., n, on peut passer à la recherche de la 
commande optimale de tout le processus pour les conditions initiales 
données x,. D’après le tableau pour f, (x) on trouve u$ correspondant 
à x, donné et l’on calcule x, = T (xs, ui). Ensuite, d’après le tableau 
pour f,_, (x) on trouve u? correspondant à zx, trouvé et l’on calcule 
Za — T (x,, ui) et ainsi de suite. Finalement, on obtient la comman- 
de optimale u* — (uÿ, uf, ..., uñ_). 

Dans le cas où u est une grandeur continue, F,; (x), u) sera une 
fonction continue de u. Mais le tableau 10-1 ne donne que les valeurs 
discrètes Fy (ati), uO)), j — 1, ..., r, de cette fonction, le mini- 
mum de F,; (x), u) pouvant correspondre à une valeur intermédiai- 
re de u. Dans ce cas, les valeurs de u* et de f, (x{ï)) doivent être 
déterminées à l’aide des formules d'interpolation. L'utilisation des 
formules d’interpolation s'avère nécessaire aussi pour la détermina- 
tion de la commande optimale uf lorsque les valeurs de x, — 


— T'(zx-y, Ux_=1) Seront situées entre les valeurs de x données au 
tableau 10-1. 


Exemple 10-1. Problème de la prise d'altitude d'un avion. Un avion vole 
à la vitesse v, à l'altitude h,. On demande de porter sa vitesse et son altitude de 
vol respectivement à v, et h, en assurant une consommation minimale de com- 
bustible. 

Représentons sur le plan (v, 4) le processus de la variation de v et de k. 
Rendons discrètes les variables en décomposant chacune des gammes de varia- 
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tion de v et de À en quatre intervalles. Ainsi, les états discrets de l’objet com- 
mandé seront représentés par les mailles dela grille donnée sur la figure 10-2. 
On considère que dans chaque maille de la grille il ne soit possible d'adopter 
que deux commandes: 

u; = 0: on fait varier seulement la vitesse v; 

u; = 1: on fait varier seulement l'altitude . 
U Po cette facon, l’ensemble des commandes admissibles sera l’ensemble 

= {0, 1}. 

Sur la cure 10-2 est représentée une des trajectoires possibles correspon- 

dant à la commande u = (01011001). Pour estimer cette trajectoire, il faut 


0 (2) 
1@))0) Ce) 
22) 7)<e) (0 
GC) @) © @-C 


J 
Fig. 10-2. Trajectoire dans le pro- Fig. 10-3. Trajectoire optimale dans 
blème de la prise d'altitude le problème de la prise d'altitude 


connaître la consommation de combustible sur chaque étape, ce qui nous amè- 
ne à la fonction objectif Q (x, u). Donnons les valeurs de Q (x, u) sous forme de 
nombres conventionnels par lesquels est marqué chacun des passages possibles 
sur la figure 10-2. Pour la trajectoire représentée sur la figure 10-2, la consom- 
mation totale de combustible, qui représente la valeur du critère d'efficacité 
de la commande, est égale à 4+4+7+5+7<+8+9+8— 52. 

Pour présenter le processus examiné en tant que processus à étapes multi- 
ples, introduisons une méthode adéquate de description des états de l’objet 
commandé. Désignons les valeurs discrètes de v par les nombres de 0 à 4 à par- 
tir de la valeur finale. Procédons de la même façon pour k. Alors, z;, sera l’état 
caractérisé par v = i et h = j et à partir duquel il reste i + j étapes jusqu’à la 
fin du processus. 

Désignons par X} l’ensemble des états à partir desquels il reste k étapes jus- 
qu’à la fin du processus. Cet ensemble comprendra tous les états z;,; pour les- 
quels i + j = k. En posant k — 0, 1, 2,..., on obtient: 


Xo—= {zoo} X1— {rio Toi}; X2—{T20 Z11, Zo2}, etc. 
On peut passer maintenant à la résolution du problème. Pour k = 1, on a: 
Xi={rio zou Fil, 0) =QG,u), f(x) min Fi(z, u). 
u 


Ces relations servent à Ja compilation du tableau 10-2 analogue au ta- 
bleau 10-*. 
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Tableau 10-2 
Calcul de la commande optimale à la dernière étape 


Q (x, u) | fa (x) 


x u x’ u* 
T10 0 T00 9 9 0 
Â _ — 
T0 0 — — 
| T00 8 8 1 


Pour k— 2,on a X, — {reg Tj1r T02}; 
Fo(z,u)=Q{(z,u)—+fi(z), fo ()= min Fa(zx, u). 


Les mêmes relations sont utilisées pour former les tableaux 10-3 et 10-1- 
Des calculs analogues sont effectués pour k = 3, 4, ... 

Pour l'exemple considéré, les données des tableaux 10-2 à 10-4 peuvent 
être représentées directement sur le plan (v, k) en indiquant les valeurs de 
fr (x) sous la forme des nombres inscrits dans les mailles correspondantes de la 
grille et en représentant u* par des flèches dirigées vers la maille suivante com- 
me il est visible sur la figure 10-3. Après avoir déterminé les valeurs de /4 (x) 
et u* pour toutes les mailles de la grille, on trouve la trajectoire optimale en 
se déplaçant à partir de la maille initiale suivant les flèches. La commande 
optimale sera u* — (11000110) pour laquelle on a J, (u*) = 37. 


Tableau 10-3 


Calcul de la commande optimale à l’avant-dernière étape 


x | u | x’ Q(x, u) {1 (x°) Fo(x, u) f2 (x) u* 
ToQ 0 Z10 9 9 18 18 0 
{ _ _ _ _ 


To 


14 1 


O0 
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Tableau 10-4 


Calcul de la commande optimale à la troisième étape à compter 
de la fin du processus 


IE | = | Q (x, u) 12(x°) F3(x, u) 13 (x) u* 
| 
z 30 0 T20 6 18 24 ” o 
To 0 ET 8 16 24 94 0 
À ToQ 8 18 26 To 
T9 0 To? g 14 23 99 1 
1 T1 6 16 22 : 
| 


L'exemple ci-avant met bien en évidence les avantages que pré- 
-sente la méthode de programmation dynamique. Premièrement, cette 
méthode supprime le problème du minimum absolu et relatif, car la 
procédure même des calculs montre que l’on trouve toujours le mi- 
nimum absolu. Deuxièmement, les contraintes de la forme |[u; | 
< M;, qui constituaient un obstacle sérieux pour l’utilisation des 
méthodes variationnelles, ne font que simplifier les calculs sui- 
vant la méthode de programmation dynamique, car elles réduisent 
le domaine des commandes admissibles U. Finalement, la méthode 
-de programmation dynamique rend incomparablement plus facile la 
recherche de la solution optimale par rapport à la méthode du triage 
des variantes. Un calcul simple permet d'illustrer cette dernière 
assertion. 

Si à chaque étape on a la possibilité d'adopter r commandes dif- 
férentes, le triage direct exige que chaque commande soit considérée 
-en Combinaison avec toutes les commandes possibles aux autres éta- 
pes, ce qui donne, pour un processus à x étapes, r° variantes. Même 
pour un problème à étapes multiples relativement simple pour r — 
— 10 et nr — 10, on obtient ainsi un nombre impressionnant de va- 
riantes (1019). 

En utilisant la méthode de programmation dynamique, lors du 
choix de la commande à une étape quelconque, pour l'état x, on ne 
prend pas en considération toutes les continuations possibles, mais 
seulement celles qui correspondent aux continuations optimales 
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à partir de l’état x’ — T (x, u). Cela permet de ne pas considérer 
une quantité énorme de variantes privées d'intérêt. Ainsi, si à cha- 
que étape il y a m états possibles et si pour chacun de ces états il 
y a r commandes, le nombre total de variantes à examiner sera rmn 
ou r°n si l’on considère que r = m, c.-à-d. que l’on a une commande 
qui assure le passage de chaque état à n'importe quel nouvel état. 
Pour r = 10 et nr — 10, cela donne en tout 10 variantes. 

Mais malgré ses mérites, la méthode de programmation dynami- 
que n’est pas exempte d'inconvénients. Ces inconvénients consistent 
dans le fait que, pour trouver la commande optimale à:partir d'un cer- 
tain état initial de l’objet, il faut aller de la fin du processus vers son 
commencement, en déterminant à chaque étape les commandes opti- 
males pour tous les états possibles de l’objet à cette étape, et 
jusqu’au dernier moment on ignore quelle sera la commande optima- 
le pour l’état initial donné. Finalement on voit que la majeure partie 
des calculs effectués reste inutilisée, car les résultats concernant les 
états qui ne se situent pas sur la trajectoire optimale ne sont pas mis 
en œuvre. À ce point de vue le principe du maximum mentionné 
plus haut présente des avantages, car il ouvre la voie à la construction 
d'une trajectoire optimale prise isolément. 


d) Commande de l’état final 


Au chapitre 6 il a été indiqué que, dans certains problèmes, l’évo- 
lution de l'objet durant la réalisation de la commande ne présente 
pas d'intérêt et ce n’est que l’état x,, dans lequel passe l’objet à la 
fin du processus de commande, qui compte. Dans ce cas, en tant que 
critère de qualité de la commande on prend la valeur de la fonction 
objectif à la fin du processus de commande, c.-à-d. la quantité 


q = q (x). (10-36) 


Désignons comme auparavant par x et u l’état de l'objet et la 
commande utilisée à À étapes de la fin du processus, et par z° — 
— T (zx, u) l'état suivant, c.-à-d. l'état de la (4 — 1)-ième etape 
à compter de la fin du processus. L’état z,, donc la fonction objectif 
q (x,) aussi, est déterminé aussi bien par la valeur initiale de zx 
que par toutes les commandes qui suivent. 

Pour obtenir la relation de récurrence définissant la commande 
optimale, désignons par F4 (x, u) la valeur de la fonction objectif 
q (zh) à k étapes de la fin du processus, pour l’état initial z, pour une 
commande arbitraire u à l'étape initiale et en présence d’une com- 
mande optimale aux # — 1 étapes restantes, et par f, (x) la valeur 
de q (x,) pour une commande optimale à toutes les À étapes qui res- 
tent jusqu'à la fin du processus, de sorte que 


fr (zx) = min Fi(zx, u). (10-37) 
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La valeur de F, (x, u) peut être obtenue en raisonnant comme 
suit. La commande arbitraire w adoptée à l'étape initiale fait passer 
l'objet commandé de l’état x à l’état x” — T (x, u). Pour obtenir 
q (zn) = Fr (zx, u), il faut adopter la commande optimale aux k—1 
étapes qui restent, ce qui donne q(zx) = fn-1 (x) = fn-1 IT (x, u)l. 
Or, c’est la valeur de F, (x, u). De cette façon, 


Fi(z,u)=fr1lT (x, u)]. (10-38) 
En portant les valeurs de F;, (x, u) dans (10-37), on obtient: 
fa (2) = min fa (T (æ, u)]. (10-39) 


La formule (10-39) est parfaitement analogue, d’après sa structu- 
re, à la formule (10-32). Si l'on lui applique la méthode de calcul déjà 
connue et si l’on prend en considération que 


fo (x) = 9 (x), (10-40) 


on peut trouver la commande optimale pour tout état initial du pro- 
cessus à étapes multiples. 


e) Relation de récurrence pour les processus markoviens 


Examinons l'application de la méthode de programmation dyna- 
mique à l'optimisation des processus stochastiques dans le cas où le 
processus stochastique est une chaîne de Markov commandée. 

Au paragraphe 5-6 on a vu qu'une chaîne de Markov peut être 
donnée sous la forme d’une matrice de probabilités des passages 
P = || p;; || d'ordre ZL X L. Pour que la chaîne de Markov soit com- 
mandée, il faut que l’on puisse changer les probabilités des passages 
Pi; en agissant de l'extérieur. Supposons que l’on puisse conduire 
le processus markovien par V procédés différents et qu’au k-ième 
procédé corresponde la matrice de probabilités des passages P, — 


= ||] p®||, k — 1, ..., N. Chaque procédé de conduire le proces- 
sus markovien sera appelé stratégie. 

En outre, nous allons considérer que l’on a la possibilité d'esti- 
mer chaque procédé de réalisation du processus en se donnant la 
matrice de paiement ou, ce qui est plus commode pour le cas considéré, 
la matrice de gains R, — || rE) |. Les grandeurs rE), il, j — 
= 1,..., L; k —1,..., N expriment le gain d’une étape au 
passage du processus de l’état i à l’état j en cas d'adoption de la 
k-ième stratégie. 


Exemple 10-2. La fabrique de téléviseurs de l'exemple 5-9 se trouvant dans 
l'état 1 peut augmenter la demande à l’aide de la réclame, mais celle-ci nécessite 
des frais supplémentaires qui font diminuer les gains. Si la fabrique se trouve 
dans l'état 2, elle peut accélérer le passage à l’état 1 en augmentant les frais 
d'études. Dans ce cas, la stratégie 1 consiste à ne pas subir des frais de réclame 
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et d’études, tandis que la stratégie 2 prévoit justement ces frais. Les matrices 
de probabilités des passages et les matrices de gains pour ces deux stratégies 
peuvent être les suivantes: 


0,5 0,51]. r=I9 31. 
os of m=fs 7]: 
={or osf5 = _wl 
7 [10,7 0,3’ 27 [4 —19 


On se propose de trouver la méthode de choix de la stratégie qui 
assure les gains maximaux pendant 7 étapes du processus markovien 
commandé. 7 

Désignons par f; (n) la valeur maximale des gains réalises en nr 
étapes à partir de l'état i. Supposons qu’en une étape on passe de 
l'état à à l'état j en réalisant le gain r{}, les n — 1 passages qui res- 
tent étant réalisés de la façon optimale. Ainsi, les gains totaux réa- 
lisés pendant x étapes seront rE) + f;(n — 1). 

Mais en réalité le premier passage de la forme (i, j) est réalisé 
avec la probabilité pf”. Etant donné que le premier passage est 
aléatoire, il faut prendre en considération la possibilité de passage 
à tous les états possibles j € {1, ..., MN}. C’est pourquoi les gains 
espérés seront : 


P,= 


N N 
Fin, k)= 2 PP + fi 0=d+ 2 phfi(n—1), (4041) 


où la quantité 


N 
g® = 2 par (10-42) 


donne les gains réalisés durant une étape à partir de l’état à et en 
utilisant la stratégie k. 

L'expression (10-41) contient la stratégie 4 adoptée à l'étape ini- 
tiale et dont le choix peut assurer les gains maximaux espérés f; (n), 
ce qui nous amène à la relation de récurrence pour le choix de la 
stratégie k à la première étape d’un processus à x étapes: 


fi(n) = max [gt +2 pf; (n—1)]. (10-43) 


Il est commode d'effectuer les calculs d’après la formule (10-43) 
en utilisant un tableau analogue à celui examiné aux paragraphes 
précédents. Ci-après sont donnés les tableaux 10-5 et 10-6 pour le 
problème de l'exemple 10-2 correspondant respectivement à r = 1 
et nr — 
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Tableau 10-5 


1 1 0,5 0,5 9 3 6 6 1 
2 0,8 0,2 4 4 4 

2 1 0,4 0,6 3 —7 —3 —3 1 
0,7 0,3 1 —19 —5 


Tableau 10-6 


2 1 


—3 0, 
—5 0, 


) à 
tÙ 


,4 —1,8 | —2,4 —1,7 
,2 —0,9 | —1,7 


tÙ 
E tt 


Pour nr > 2, les tableaux sont du type du tableau pour nr — 2. 


PROBLÈMES AU CHAPITRE 10 


10-1. Continuer la résolution de l'exemple 10-1 et calculer la trajectoire 
optimale tout entière. 

10-2. En considérant la grille de la figure 10-3 en tant que graphe, trouver 
la trajectoire optimale à l’aide des méthodes de détermination du plus court 
chemin dans le graphe, exposées au paragraphe 2-2. Comparer cette solution 
à celle de la méthode de programmation dynamique. 

40-3. Trouver la commande optimale pour un processus de commande 
à trois étapes de la grandeur scalaire z. En début du processus, x peut être un 
entier quelconque compris entre —10 et +10. Aux différentes étapes, on réalise 
des transformations de la forme zx’ — T'(z,u) — x + u, les valeurs admissi- 
bles de u étant définies par les ensembles: 

{—1, 0, +1} à la première étape; 

{—4, 0, +4} à la deuxième étape; 

{—9, 0, +9} à la traisiéme étape. 

Le but du processus est de porter en trois étapes la grandeur zx à une valeur 
donnée prise égale à zéro. Les pertes sont estimées par le carré de l'écart de x 
par rapport à O en fin de processus, c.-à-d. par la quantité q (r) — (x — 0} = x. 


OU OO  ODD 2 
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